Academia.eduAcademia.edu

Metanálise: um guia prático

2010

Metanálise: um guia prático Autora: Caroline Legramanti Rodrigues Orientadora: Professora Dra. Patrícia Klarmann Ziegelmann Porto Alegre, 28 de junho de 2010. Universidade Federal do Rio Grande do Sul Instituto de Matemática Departamento de Estatística Metanálise: um guia prático Autora: Caroline Legramanti Rodrigues Monografia apresentada para obtenção do grau de Bacharel em Estatística. Banca Examinadora: Professora Dra. Patrícia Klarmann Ziegelmann Professora Dra. Luciana Neves Nunes Porto Alegre, 28 de junho de 2010. 1 Dedico este trabalho aos meus pais, Enio e Jovilde, que sempre colocaram a educação dos filhos acima de qualquer outra coisa e que me ensinaram que o conhecimento é o que eu posso adquirir de mais valioso, pois ninguém jamais poderá tirá-lo de mim. 2 “O mundo está nas mãos daqueles que tem a coragem de sonhar e de correr o risco de viver seus sonhos." (Paulo Coelho) 3 Agradecimentos À professora Patrícia pela paciência e dedicação não só na orientação deste trabalho, mas também por ter sido minha tutora no início do curso, pelo ano em que fui monitora de suas disciplinas e pelas ótimas aulas de Inferência Bayesiana. Será sempre uma referência para mim. À professora Luciana por ter aceitado fazer parte da minha banca e por ser uma das professoras mais próxima dos alunos que eu conheço. Ao amor da minha vida, Jorge, por ter aguentado meu mau humor quando eu ia mal em alguma disciplina, minha falta de tempo, principalmente neste último semestre, e por não tocar guitarra ou bateria quando eu precisava estudar. À minha família que sempre apostou e torceu por mim. Aos colegas e amigos que fiz durante estes anos de Estatística, em especial à Simone Lumertz que se tornou minha amiga inseparável desde o primeiro dia de aula; à Julia Bastiani que tentou (sem sucesso) me ensinar como cursar Estatística sem se estressar, acho que eu fui quem ensinou ela a ficar um pouco estressada; à Lisiane Moura por ser a melhor professora particular que eu já tive e ao Gilberto Beuren por me fazer rir, mesmo quando o momento não era apropriado. E mais que especial à minha querida amiga Marjana Peixoto que me acompanhou nos melhores e piores momentos do curso, mesmo agora que ela já está formada, ela está sempre me consolando e motivando, certamente a amizade dela é o que eu vou levar de melhor destes anos de UFRGS. Ao Renato Carlson que foi meu professor de Estatística na Unisinos, quando eu fazia Administração, o culpado (no bom sentido) por eu ter mudado de curso e que tem acompanhado minha trajetória na Estatística. Aos meus chefes e colegas da Cientec e da Siqueira Campos, estágios por onde passei. Aos meus chefes e colegas de CRM da Renner que me contrataram, mesmo sabendo que eu ainda não estava formada e que precisava sair no meio do trabalho pra ir à aula. A todos os meus amigos de fora da UFRGS que me apoiaram, mesmo os que estão longe, mas sempre torcendo por mim. A todos os professores do departamento de Estatística, até mesmo aos poucos e maus professores que me fizeram dar mais valor ainda aos bons. 4 Resumo Este trabalho tem como objetivo servir como um guia prático para pessoas que queiram conduzir uma metanálise. Para isto, são descritas as medidas de efeito mais comumente utilizadas em metanálises na área da saúde, bem como os modelos de efeito fixo e de efeitos aleatórios. Alguns conceitos de heterogeneidade e de como detectá-la também são apresentados. Para mostrar um passo a passo de como conduzir uma metanálise são apresentados três exemplos, cada um com diferentes tipos de estudos a serem combinados, sendo o primeiro com estudos para comparar dois grupos com dados binários, o segundo para comparar dois grupos com dados contínuos e o terceiro para um grupo com dados binários, estes exemplos foram feitos com os softwares STATA e R. 5 Abstract The goal of this paper is to serve as a practical guide for people who want to conduct a meta-analysis. For this, the most commonly effect measures used in meta-analysis of medical area are described. Fixed effect models and random effects models are described too. Some concepts of heterogeneity and how to detect it are also presented. To show a step by step how to conduct a meta-analysis are presented three examples, each one with different types of studies to be combined, the first with studies to compare two groups with binary data, the second to compare two groups with continuous data and the third for a group with binary data, these examples were done with STATA and R. 6 Sumário 1. Introdução........................................................................................................................ 9 2. Medidas de efeito............................................................................................................. 11 2.1. Medidas de efeito para um grupo…………......................................................11 2.1.1. Odds ou chances..................................................................................... 12 2.1.2. Incidência................................................................................................ 12 2.2. Medidas de efeito para comparação de dois grupos através de variáveis binárias.............................................................................................................. 12 2.2.1. Odds ratio ou razão de chances.............................................................. 13 2.2.2. Odds ratio de Peto ou razão de chances de Peto.................................... 14 2.2.3. Risco relativo.......................................................................................... 14 2.2.4. Redução absoluta de risco...................................................................... 15 2.2.5. Número necessário para tratar................................................................ 15 2.3. Medidas de efeito para comparação de dois grupos através de variáveis contínuas............................................................................................................. 16 2.3.1. Diferença absoluta entre médias............................................................. 16 2.3.2. Diferença padronizada entre médias....................................................... 17 3. Modelos de efeito fixo e modelos de efeitos aleatórios................................................... 18 3.1. Modelo de efeito fixo........................................................................................ 18 3.1.1. Estimação da medida metanalítica θM..................................................... 19 3.1.2. Método de Mantel-Haenszel................................................................... 19 3.2. Modelo de efeitos aleatórios............................................................................... 22 3.2.1. Estimação da medida metanalítica θM*.................................................. 23 3.2.2. Método de DerSimonian e Laird…........................................................ 24 4. Heterogeneidade.............................................................................................................. 25 4.1. Separação da variação....................................................................................... 26 4.2. Teste Q de Cochran........................................................................................... 26 4.3. Estatística I2...................................................................................................... 27 7 5. Forest plot........................................................................................................................27 6. Escolha do modelo...........................................................................................................28 7. Metanálise no STATA..................................................................................................... 28 7.1. Comando metan................................................................................................ 29 7.2. Exemplo: comparação de dois grupos com dados binários.............................. 30 7.3. Exemplo: comparação de dois grupos com dados contínuos............................36 7.4. Exemplo: um grupo com dados binários.......................................................... 41 8. Metanálise no R............................................................................................................... 46 8.1. Pacote metafor.................................................................................................. 46 8.2. Exemplo: comparação de dois grupos com dados binários.............................. 47 8.3. Exemplo: comparação de dois grupos com dados contínuos............................49 9. Considerações finais........................................................................................................ 51 Referências Bibliográficas.................................................................................................. 52 8 1. Introdução A pesquisa é algo recorrente em todas as áreas e, hoje em dia, com a facilidade dos meios de comunicação, é possível encontrar inúmeros estudos sobre a mesma questão de pesquisa. Com uma infinidade de estudos disponíveis surgem alguns problemas como, quais estudos escolher para a pesquisa, como tirar conclusões se alguns divergem entre si, quais têm as melhores conclusões, entre outras dúvidas que podem surgir. Uma maneira de resolver estes problemas é combinar os resultados dos estudos. Uma maneira de se pensar quando se deseja combinar vários estudos é simplesmente juntar os dados dos estudos e analisar como se fossem informações retiradas de apenas um amplo estudo. Porém, esta maneira desconsidera completamente a variabilidade e o tamanho de cada estudo, que tem importante influência no resultado e deveriam ser considerados. A maneira mais apropriada é utilizar técnicas estatísticas adequadas. Estas técnicas serão detalhadas neste trabalho e englobam o que é conhecido na literatura como metanálise. A metanálise é um tipo de análise de dados em que os resultados de vários estudos, que abordam a mesma questão de pesquisa são combinados, gerando assim, estimativas que resumem o todo chamadas de estimativas metanalíticas. Os estudos que compõem uma metanálise são escolhidos através de uma revisão sistemática. Uma revisão sistemática consiste de um conjunto de regras para identificar estudos sobre uma determinada questão e, em seguida, selecionar quais deles serão incluídos ou não na metanálise. Para que a revisão sistemática seja útil, são necessários muitos estudos sobre a questão, mas que não tenham tanta concordância entre si a ponto da questão já estar respondida. Na Tabela 1.1 estão os elementos de uma revisão sistemática (Fletcher & Fletcher, 2006). Tabela 1.1 - Elementos de uma Revisão Sistemática 1. Definir a questão clínica. 2. Identificar todos os estudos completos sobre a questão, publicados ou não. 3. Selecionar os estudos que preencham padrões elevados de validade científica. 4. Procurar por evidências de viés nos estudos selecionados. 5. Descrever a qualidade científica dos estudos. 6. Questionar se a qualidade está sistematicamente relacionada aos resultados do estudo. 7. Descrever os estudos com uma figura (gráfico de floresta). 8. Decidir se os estudos são suficientemente semelhantes para justificar uma combinação. 9. Se eles forem suficientemente semelhantes para serem combinados, calcular uma medida sumária de efeito e seu intervalo de confiança. 9 Não são recentes as tentativas de unir os resultados de diferentes estudos. A primeira metanálise da história é atribuída ao estatístico Karl Pearson. Em 1904, Pearson combinou, através de correlações, os dados de cinco estudos para examinar o efeito preventivo de inoculações contra febre entérica (Pearson, 1904). Os motivos relatados por Pearson para a combinação de estudos são, ainda hoje, as principais razões para o uso da metanálise. O principal argumento é que muitos dos estudos são pequenos para permitir uma conclusão confiável, fazendo com que o tamanho do erro seja grande e o poder do estudo seja baixo. Em 1931 e 1932, Tippet e Fisher, apresentaram métodos para a combinação de valores p (Whitehead, 2002). Em 1938, Yates e Cochran consideraram a combinação de estimativas a partir de diferentes experimentos agrícolas (Yates & Cochran, 1938), esses autores desdobraram essa fonte de variação para cada genótipo, determinando uma regressão linear da produtividade em relação à média de todos eles, por ambiente. A primeira metanálise para avaliar o efeito de uma intervenção terapêutica foi publicada em 1955 (Whitehead, 2002). Na década de 1970, a metanálise passou a ser usada nas ciências sociais, principalmente em pesquisas de educação. Porém, o termo “metanálise” ainda não era utilizado. Foi em 1977, que o termo “metanálise” foi utilizado pela primeira vez em um artigo intitulado “Primary, secondary and meta-analysis of research” pelo psicólogo Gene Glass (Glass, 1977). Na área médica, a metanálise passou a ser utilizada com mais frequência na década de 1980. Questões chave da medicina passaram a ser respondidas com a metanálise, como o tratamento de doenças do coração e de câncer (Whitehead, 2002). Em 1993, uma rede de clínicos, epidemiologistas e outros profissionais da saúde fundaram o Cochrane Collaboration, que tem por objetivo elaborar, manter e divulgar revisões sistemáticas da área da saúde. Desde sua fundação em Oxford, o Centro Cochrane tem crescido rapidamente e diversos centros foram fundados na Europa, América do Norte e Latina, África e Austrália com centenas de pessoas colaborando em grupos de revisão. No Brasil, o Centro Cochrane foi inaugurado em 1996 em São Paulo. Para conhecer mais sobre o Centro Cochrane e utilizar seus materiais de pesquisa, é possível acessar a página na internet http://www.centrocochranedobrasil.org.br/, na página são encontrados links para os outros centros e suas bibliotecas virtuais. O uso da metanálise vem crescendo nas mais diversas áreas, como em ciências sociais, agricultura, ecologia, veterinária, entre outras; mas certamente, é a medicina a área que mais utilizou e utiliza metanálises até hoje (Whitehead, 2002). 10 O objetivo deste trabalho é apresentar os conceitos básicos de uma metanálise e servir de guia para pessoas que queiram conduzir uma com o uso dos softwares STATA e R, já que existem poucos materiais neste formato em português. Para o leitor que queira aprofundar mais seus conhecimentos em metanálise sugere-se Sutton, 2000; Borestein, 2009; Egger, 2009, entre outros (ver referências bibliográficas). O foco deste trabalho será voltado à área da saúde, mas lembrando que uma metanálise pode ser conduzida em qualquer outra área. Para este propósito no Capítulo 2 serão descritas algumas das medidas de efeito mais comumente utilizadas em metanálises na área da saúde, no Capítulo 3 serão abordados os modelos de efeito fixo e de efeitos aleatórios, no Capítulo 4 serão introduzidas algumas noções de heterogeneidade e de como detectá-la, no Capítulo 5 será apresentado o forest plot, no Capítulo 6 será dado um breve relato de como escolher o melhor modelo para conduzir uma metanálise, no Capítulo 7 será mostrado como conduzir uma metanálise utilizando o software STATA e no Capítulo 8 como conduzir uma metanálise no software R. 2. Medidas de efeito Para que estudos possam ser combinados em uma metanálise, é necessário escolher uma medida de efeito e calculá-la para cada estudo, com isso eles poderão ser combinados através dessa medida. Medidas de efeito podem ser classificadas de diferentes maneiras. Neste trabalho elas serão classificadas em quatro categorias: medidas de efeito para descrever apenas um grupo com uma só variável binária, medidas de efeito para comparar dois grupos através de variáveis binárias, medidas de efeito para comparar dois grupos através de variáveis contínuas e medidas de efeito para grupos com dados categóricos ordinais. Neste trabalho serão brevemente descritas algumas medidas de efeito para as três primeiras categorias. Para um estudo mais aprofundado destas medidas e das medidas de efeito para dados categóricos veja Sutton, 2000. 2.1. Medidas de efeito para um grupo Medidas de efeito para um grupo são utilizadas quando o interesse é descrever um estudo ou estimar um efeito. As medidas de efeito mais utilizadas para um grupo são o odds e a incidência. Estimativas destas medidas são calculadas e seu uso em metanálise requer também uma medida de variabilidade. 11 2.1.1. Odds ou chances Por definição odds é a razão entre a probabilidade de o evento ocorrer e a probabilidade do evento não ocorrer que, matematicamente, é equivalente a razão entre o número de eventos e o número de não eventos. Por questões teóricas, geralmente o odds é calculado em escala logarítmica. O logaritmo do odds de um estudo j é estimado por  aj ln(Odds) j = ln b  j     (2.1) onde aj é o número de indivíduos que sofreu o evento no estudo j e bj é o número de indivíduos que não sofreu o evento no estudo j, com j = 1, 2, ..., J. A variância do logaritmo do odds é estimada por var(ln(Odds )) j = 1 1 + a j bj (2.2) 2.1.2. Incidência A incidência mede o número de novos casos surgidos numa determinada população e num determinado intervalo de tempo. Ela também é usualmente calculada em escala logarítmica. O logaritmo da incidência de um estudo j é estimado por d  ln( Incid ) j = ln j  q   j onde dj são os eventos observados no estudo j em qj unidades de tempo. A variância do logaritmo da incidência é estimada por var(ln(Incid )) j = 1 dj 2.2. Medidas de efeito para comparação de dois grupos através de variáveis binárias Os dados provenientes de estudos que comparam dois grupos quanto a uma variável binária (ocorrência ou não de um evento de interesse), geralmente são organizados em tabelas 2 x 2, conforme a seguir. 12 Tabela 2.1 - Dados de um estudo j Eventos Não eventos aj cj bj dj Grupo 1 Grupo 2 Tamanho do grupo n1j n2j Os dois grupos comparados (Grupo 1 e Grupo 2) podem ser o grupo tratado e o grupo controle de um ensaio clínico ou o grupo exposto e o grupo não exposto a determinado fator de um estudo longitudinal, ou ainda, eventos e não eventos podem ser os casos e os controles em um estudo caso-controle. As medidas de efeito mais comuns calculadas para este tipo de dados são odds ratio, risco relativo, redução absoluta de risco e número necessário para tratar. 2.2.1. Odds ratio ou razão de chances O odds ratio expressa quantas vezes o odds de um grupo equivale ao odds do outro grupo. O odds ratio de um estudo j é estimado por OR j = a j /bj cj /d j = a jd j bjc j onde aj, bj, cj e dj são as células da Tabela 2.1, com j = 1, 2, ..., J. Por questões teóricas o odds ratio pode ser estimado em escala logarítmica, ou seja, a d  ln(OR j ) = ln j j  bc   j j O odds ratio varia de 0 a infinito. Um odds ratio igual a 1 indica que não existe diferença entre os odds dos dois grupos, um odds ratio menor que 1 indica que o grupo 1 tem odds menor que o grupo 2 e um odds ratio maior que 1 indica o contrário. Uma maneira usual de se calcular a estimativa da variância do logaritmo do odds ratio é utilizar o método de Woolf, onde var(ln(OR j )) = 1 1 1 1 + + + a j bj c j d j (2.3) Note que na expressão (2.3) se algum dos eventos for igual a zero (aj, bj, cj ou dj = 0) ela é indefinida. Uma maneira usual de corrigir esse problema é somar 0,5 em cada célula da 13 Tabela 2.1. Neste caso, a estimativa do odds ratio também deve ser feita com os dados de todas as caselas somados de 0,5 (Sutton, 2000). 2.2.2. Odds ratio de Peto ou razão de chances de Peto O odds ratio de Peto é uma forma alternativa de se estimar o odds ratio, a ideia e a interpretação são as mesmas, mas uma diferença relevante é que no odds ratio de Peto, aj, bj, cj ou dj podem ser iguais a zero. O odds ratio de Peto é particularmente útil quando os tamanhos das amostras dos grupos não são muito diferentes. O odds ratio de Peto do estudo j é estimado por  Oj − Ej ORPj = exp  V j      onde Oj é o número de respostas observadas no grupo tratamento, Ej é o número de respostas esperadas no grupo tratamento e Vj é uma estimativa da variância da diferença entre Oj e Vj, ou seja, Oj = aj Ej = Vj = n1 j (a j + c j ) n1 j + n2 j n1 j n2 j (a j + c j )(b j + d j ) (n1 j + n2 j ) 2 (n1 j + n2 j − 1) 2.2.3. Risco relativo O risco relativo é definido como a razão entre a probabilidade do evento ocorrer no grupo 1 e a probabilidade do evento ocorrer no grupo 2. O risco relativo de um estudo j é estimado por RR j = a j / n1 j c j / n2 j = a j n2 j c j n1 j Assim como o odds ratio, o risco relativo também é calculado muitas vezes na escala logarítmica por questões teóricas, ou seja, 14 a n  ln( RR j ) = ln j 2 j  cn   j 1j  O risco relativo varia de 0 a infinito. Um risco relativo igual a 1 indica que os dois grupos apresentam o mesmo risco, um risco relativo menor que 1 indica que o grupo 1 tem risco menor que o grupo 2 e um risco relativo maior que 1 indica o contrário. Assim como no odds ratio, é usual calcular a estimativa da variância do logaritmo do risco relativo, estimada por 1 1 1 1 − + − a j n1 j c j n2 j var(ln(RR j )) = (2.4) Note que na expressão (2.4) se algum dos eventos aj ou cj for igual a zero, ela é indefinida. Neste caso, o problema também pode ser corrigido com a soma de 0,5 em cada célula da Tabela 2.1. Assim, a estimativa do risco relativo também deve ser feita com os dados de todas as caselas somados de 0,5. 2.2.4. Redução absoluta de risco A redução absoluta de risco é definida como a diferença entre as probabilidades de ocorrer o evento nos dois grupos. A redução absoluta do risco em um estudo j é estimada por RAR j = aj n1 j − cj n2 j E sua variância é estimada por var(RAR j ) = a jb j n1 j 3 + c jd j n2 j 3 2.2.5. Número necessário para tratar O número necessário para tratar é utilizado quando os grupos são tratamento e controle e pode ser interpretado como o número de indivíduos que devem ser tratados com o tratamento a fim de prevenir um evento. 15 O número necessário para tratar é dado pelo inverso da redução absoluta de risco NNT j = 1 RAR j Assim, a variância também é estimada pelo inverso da variância da redução absoluta do risco var( NNT j ) = 1 var( RAR j ) 2.3. Medidas de efeito para comparação de dois grupos através de variáveis contínuas Quando os dados de estudos são medidos em uma escala contínua, é comum aparecerem médias e desvios padrão nos relatórios para resumir as informações. Utilizando média e desvio padrão, as medidas de efeito mais comuns para dados contínuos são a diferença absoluta entre médias e a diferença padronizada entre médias. 2.3.1. Diferença absoluta entre médias A diferença absoluta entre as médias quantifica a diferença entre a média do grupo 1 e a média do grupo 2. Note que ela só deve ser utilizada quando todos os estudos da metanálise utilizam a mesma escala contínua. A diferença absoluta entre as médias de um estudo j é estimada por Dˆ j = x1 j − x2 j onde x1 j é a média do grupo 1 e x2 j é a média do grupo 2. Quando se assume que as variâncias das duas populações são iguais, a variância da diferença do estudo j é estimada por  1 1  + var( Dˆ j ) = s 2p j   n1   j n2 j  onde n1 j é o tamanho da amostra do grupo 1, n2 j é o tamanho da amostra do grupo 2 e s 2p j é a variância conjunta dos dois grupos, dada por 16 s 2 pj = (n1 j − 1) s12j + (n2t − 1) s22 j n1 j + n2 j − 2 (2.5) onde s12j e s22j são as variâncias dos grupos 1 e 2, respectivamente. Quando não se assume que as variâncias das duas populações são iguais, então a variância da diferença do estudo j é estimada por var(Dˆ j ) = s12 s2 + 2 n1 j n2 j 2.3.2. Diferença padronizada entre médias A diferença padronizada entre médias pode ser utilizada quando os estudos vem de populações com dados contínuos, mas que usam diferentes escalas, por exemplo, diferentes testes psicológicos. Existem três maneiras diferentes de se estimar a diferença padronizada entre médias, são elas: d de Cohen, g ajustado de Hedges e de Glass. Estes métodos diferem quanto ao uso do desvio padrão nos cálculos e quanto ao uso ou não de correção para evitar vício quando as amostras são pequenas. d de Cohen O d de Cohen é a diferença média de cada estudo dividida pelo desvio padrão, criando assim uma medida padrão que possa ser comparável entre os estudos. O d de Cohen é estimado por dj = x1 j − x2 j s 2p j onde s 2p j é a variância dada em (2.5). A variância de d j é estimada por var(d j ) = n1 j + n2 j n1 j n2 j + d 2j 2(n1 j + n2 j − 2) 17 g ajustado de Hedges O g ajustado de Hedges é similar ao d de Cohen, porém ele inclui um ajuste para corrigir o vício de amostras pequenas. O g é definido como gj =  x1 j − x2 j  3 1 −  s 2p j  4(n1 j + n2 j ) − 9  A variância de g j é estimada por var( g j ) = n1 j + n2 j n1 j n2 j + g 2j 2(n1 j + n2 j − 3,94) de Glass O médias. O de Glass utiliza o desvio padrão do grupo controle para dividir a diferença de de Glass é dado por ∆j = x1 j − x2 j s22j A variância de ∆ j é estimada por var(∆ j ) = n1 j + n2 j n1 j n2 j + ∆2j 2(n2 j − 1) 3. Modelos de efeito fixo e modelos de efeitos aleatórios Em metanálise são utilizados basicamente dois tipos de modelos, os modelos de efeito fixo e os modelos de efeitos aleatórios. Estes dois modelos são descritos nas Seções 3.1 e 3.2, respectivamente. 3.1. Modelo de efeito fixo Em um modelo de efeito fixo assume-se que o efeito de interesse é o mesmo em todos os estudos e que as diferenças entre eles são devidas apenas à variabilidade interna de cada estudo. Seja J o número de estudos de uma metanálise e Yj o efeito observado no estudo j com j=1, 2, ..., J, o modelo de efeito fixo é dado por 18 Yj = θM + ε j onde εj é o erro aleatório do estudo j e θM é o efeito comum a todos os estudos chamado de medida metanalítica. Os erros aleatórios são supostos terem distribuição normal com média 0 e variância σj2 conhecida (εj ~ N(0, σj2)), é por este motivo que medidas como odds ratio, risco relativo, odds e incidência são calculados em escala logarítmica. Note que a variância conhecida σj2 é a variância do efeito de interesse estimada no estudo j. 3.1.1. Estimação da medida metanalítica θM O estimador de máxima verossimilhança de θM é dado por Yj J θˆMV = ∑σ j =1 2 j 1 J ∑σ j =1 J ∑W Y j j =1 J = ∑W 2 j j =1 j (3.1) j Note que θˆMV é uma média ponderada dos efeitos observados (Y1, Y2, ..., Yj), sendo o peso (Wj) dado a cada estudo j igual ao inverso da variância do estudo j. A variância da medida metanalítica θˆMV é estimada por σˆ θ2ˆ MV = 1 J ∑W j =1 j Um intervalo de confiança assintótico para θM é dado por LI θ MV = θˆMV − zα × σˆ θ2ˆ 2 MV e LS θ MV = θˆMV − zα × σˆ θ2ˆ 2 ( onde zα é o valor que acumula a probabilidade 1 − α 2 MV 2 ) na distribuição Normal padrão. 3.1.2. Método de Mantel-Haenszel Uma maneira alternativa de calcular a medida metanalítica é através do método de Mantel-Haenszel. Este método foi originalmente proposto para combinar odds ratios oriundos 19 de diferentes estratos quando não são detectadas diferenças significativas entre eles. Por exemplo, combinar a razão entre o odds de infarto do miocárdio entre indivíduos com pressão arterial elevada e o odds de infarto do miocárdio entre indivíduos sem pressão arterial elevada de dois estratos: indivíduos com até 60 anos e indivíduos com mais de 60 anos. Nesta situação, se o efeito (medido em odds ratio) da pressão arterial elevada no infarto do miocárdio não foi significativamente diferente nos dois estratos de idade considerados, a combinação destes efeitos através do método de Mantel-Haenszel avalia o efeito do fator pressão arterial elevada no desfecho infarto do miocárdio controlado pela covariável idade. No contexto de metanálise, o método de Mantel-Haenszel é utilizado para combinar medidas de efeito oriundas de diferentes estudos quando a suposição é de que o efeito é o mesmo em todos os eles, ou seja, a mesma suposição do modelo de efeito fixo. Quando comparado com o modelo de efeito fixo, o método de Mantel-Haenszel é mais robusto quando as amostras forem pequenas, visto que, nestas situações produz estimativas melhores para os erros padrão das medidas de efeito. A medida metanalítica calculada através do método de Mantel-Haenszel é estimada por J θˆ MH ∑W Y = j =1 J j ∑W j =1 j (3.2) j Note que as expressões (3.1) e (3.2) são as mesmas, o que muda no Mantel-Haenszel é a maneira de calcular os pesos Wj e, consequentemente, a estimativa da variância de θˆMH . No método de Mantel-Haenszel, o cálculo do peso Wj depende da medida de efeito a ser combinada. Mantel-Haenszel para combinar odds ratios: quando o interesse for combinar odds ratios utilizando o método de Mantel-Haenszel, o peso Wj de cada estudo é calculado da seguinte forma Wj = bjc j n1 j + n2 j A variância da medida metanalítica θˆMH é, então, estimada por 20 1 E F +G H σˆθ2ˆ =  2 + +  2 R R + S S 2  MH onde J ajd j j =1 n1 j + n2 j R=∑ J bjc j j =1 n1 j + n2 j S =∑ J (a j + d j )a j d j j =1 (n1 j + n2 j ) 2 E =∑ J (a j + d j )b j c j j =1 (n1 j + n2 j ) 2 J (b j + c j )a j d j j =1 (n1 j + n2 j ) 2 J (b j + c j )b j c j j =1 (n1 j + n2 j ) 2 F =∑ G=∑ H =∑ Mantel-Haenszel para combinar riscos relativos: para combinar riscos relativos, o peso de cada estudo j é dado por Wj = c j n1 j n1 j + n2 j A variância da medida metanalítica θˆMH é, então, estimada por σˆθ2ˆ MH = P T ×U onde J n1 j n2 j (a j + c j ) − a j c j (n1 j + n2 j ) j =1 (n1 j + n2 j ) 2 P=∑ 21 J a j n2 j j =1 n1 j + n2 j T =∑ J c j n1 j j =1 n1 j + n2 j U =∑ Mantel-Haenszel para combinar reduções absolutas de risco: para combinar reduções absolutas de risco, o peso de cada estudo j é dado por Wj = n1 j n2 j n1 j + n2 j A variância da medida metanalítica θˆMH é, então, estimada por σˆθ2ˆ = MH L M2 onde J a j b j n23 j + c j d j n13j j =1 n1 j n2 j (n1 j + n2 j ) 2 L=∑ J n1 j n2 j j =1 n1 j + n2 j M =∑ 3.2. Modelo de efeitos aleatórios Quando se decide combinar estudos em uma metanálise é porque foi feita uma revisão sistemática e foram escolhidos estudos que são parecidos ao ponto de ser coerente juntar a informação deles em uma medida resumo. Mas existem razões para que os estudos não sejam considerados idênticos quanto ao efeito do tratamento como, por exemplo, se o interesse for estudos em que está sendo testada a eficácia de um medicamento, entre eles pode haver diferença nos grupos de pessoas selecionadas, um grupo pode ser mais saudável em um estudo do que em outro, a faixa etária dos pacientes pode variar de estudo para estudo, a classe social pode ser diferente, entre outros fatores que podem influenciar para que o efeito do tratamento seja diferente entre os estudos. Quando isto acontece, estas diferenças devem ser investigadas e alternativas como metanálise em subgrupos e meta regressão devem ser consideradas. Outra alternativa é a utilização de um modelo de efeitos aleatórios. Este modelo considera a existência não apenas da variação dentro de cada estudo, mas também a variação 22 entre os estudos, ou seja, ele considera que os efeitos dos estudos não são iguais, mas que são conectados através de uma distribuição de probabilidade, geralmente suposta normal. O modelo de efeitos aleatórios é dado por Yj = θM + ζ j + ε j onde εj é o erro aleatório do estudo j, ζj é o efeito aleatório de cada estudo j e θM é a medida metanalítica. No modelo de efeitos aleatórios existe a suposição de que os erros aleatórios têm distribuição normal com média 0 e variância conhecida σj2 (εj ~ N(0, σj2)) e os efeitos aleatórios tem distribuição normal com média 0 e variância desconhecida τ² (ζj ~ N(0, τ2)). Como ζj e εj são independentes, tem-se que Yj ~ N(θM, τ2+ σj2). O parâmetro τ2 representa a variabilidade entre os estudos e deve ser estimado. 3.2.1. Estimação da medida metanalítica θM* A notação usada para modelos de efeitos aleatórios será a mesma usada anteriormente para modelos de efeito fixo, para diferenciar um do outro um asterisco (*) indicará que é um modelo de efeitos aleatórios. Note que o modelo de efeitos aleatórios possui dois parâmetros desconhecidos: a medida metanalítica θ M* e a variância entre os estudos τ2. O estimador de máxima verossimilhança de θM é dado por J * θˆMV ∑σ Yj J + τˆ 2 j =1 = = J 1 ∑ 2 2 j =1 σ j + τˆ 2 j ∑W Y j =1 J * j j ∑W j =1 (3.3) * j Nos modelos de efeito fixo a cada estudo é atribuído um peso que pode ser o inverso da variância. Em modelos de efeitos aleatórios o peso também pode ser o inverso da variância, mas nesse caso é somada a variância dentre os estudos σj2 e a variância entre os estudos τˆ 2 . O peso para modelos de efeitos aleatórios é dado por W j* = 1 ˆ VYj onde VˆYj é a variância estimada de Yj e é dada por VˆYj = σ 2j + τˆ 2 23 A variância da medida metanalítica é estimada por 1 * σˆθ2ˆ = MV J ∑W j =1 * j * Analisando a expressão (3.3) é possível notar que a estimativa de θ MV depende da estimativa de τ2. O estimador de máxima verossimilhança de τ2 é dado por J ∑ τˆ = 2 j =1 * ) 2 − σ 2j (Y j − θˆMV (σ 2j + τ 2j ) 2 J 1 ∑ 2 2 2 j =1 (σ j + τ j ) (3.4) * Como σj2 pode ser superior a (Y j − θˆMV ) 2 para um dado j, consideraremos o estimador 2 de τ 2 dado por de máxima verossimilhança τˆMV  0, se τˆ 2 ≤ 0 2 τˆMV = 2 τˆ , caso contrário * Analisando a expressão (3.4) é possível notar que a estimativa de τ2 depende de θ MV , portanto estas estimativas só podem ser obtidas por métodos iterativos (Brockwell e Gordon, 2001). 3.2.2. Método de DerSimonian e Laird Baseado na suposição de que os estudos incluídos na metanálise são homogêneos (apresentam a mesma medida de efeito) nem sempre é realística, DerSimonian e Laird propuseram estimar a medida metanalítica através do estimador pelo método dos momentos, ou seja, J θˆ* DSL ∑σ Yj + τˆ 2 = 1 ∑ 2 2 j =1 σ j + τˆ j =1 J 2 j (3.5) É possível notar que o estimador de θ M* pelo método dos momentos (3.5) é igual ao estimador de máxima verossimilhança (3.3). Ambos dependem dos efeitos observados Yj, 24 suas variâncias conhecidas σj2 e da variância entre os estudos τ2 desconhecida. Na seção anterior foi mostrado como estimar τ2 pelo método da máxima verossimilhança, uma alternativa para estimar τ2 é utilizar o método dos momentos proposta por DerSimonian e Laird. Neste caso, τˆ 2 = Q − gl C (3.6) onde, 2   J  ∑W j Y j    J j =1  , Q = ∑W jY j2 −  J j =1 ∑W j (3.7) j =1 J J C = ∑W j − j =1 ∑W j =1 J ∑W j =1 Wj = 2 j , j 1 , σ + τˆ 2 2 j gl = J − 1 (3.8) (3.9) onde J é o número total de estudos. Note que τˆ 2 na expressão (3.6) e Wj na expressão (3.8) dependem um do outro para serem estimados, portanto, estas estimativas só podem ser obtidas através de métodos iterativos. 4. Heterogeneidade Em metanálises, quando a variabilidade entre os estudos não é apenas aleatória, dizemos que os estudos são heterogêneos. A avaliação sobre heterogeneidade tem papel importante na escolha do modelo de metanálise e, portanto, deve ser realizada antes da escolha do modelo. As maneiras mais usuais de se verificar a existência de heterogeneidade em metanálises são pelo teste Q de Cochran ou pela estatística I² de Higgins e Thompson. 25 Quando nos referimos à heterogeneidade em medidas de efeito, pensamos na sua verdadeira variação. No entanto, essa variação é constituída da verdadeira heterogeneidade e também do erro aleatório. 4.1. Separação da variação Os efeitos observados variam por dois motivos. Um deles é a verdadeira heterogeneidade na medida de efeito, já o outro é o erro aleatório dentro do estudo. Para quantificar a heterogeneidade é necessário separar a variação nestes dois componentes. Para separar estas variações é necessário calcular a variação total observada de estudo a estudo, estimar o quanto os efeitos observados devem variar supondo homogeneidade entre os estudos e então calcular o excesso de variação pela diferença da variação total pela variação supondo homogeneidade, esta é a heterogeneidade. Para obtermos a variação total, usamos a estatística Q, que é definida como, J Q = ∑W j (Y j − θˆM ) 2 , (4.1) j =1 onde Wj é o peso do estudo j, Yj é a medida de efeito do estudo j e θˆM é a estimativa para a medida metanalítica. A equação (4.1) é equivalente a (3.7). O próximo passo é determinar o valor esperado de Q assumindo que os estudos são homogêneos. Neste caso ele é simplesmente os graus de liberdade (gl), definido em (3.9). O excesso de variação é a diferença entre Q e os graus de liberdade, Q − gl , que é a parte da variação atribuída à verdadeira diferença dos efeitos de estudo a estudo. 4.2. Teste Q de Cochran O teste Q de Cochran apresenta como hipótese nula a afirmação de que os estudos que compõem a metanálise são homogêneos. Sob esta hipótese nula, Q segue uma distribuição qui-quadrado com J – 1 graus de liberdade, onde J é o número total de estudos que compõem a metanálise. A estatística Q do teste de Cochran é o Q definido em (4.1), Cochran propôs esta estatística que posteriormente foi utilizada por DerSimonian e Laird para estimar τ2, conforme visto na seção 3.2.1. 26 Uma deficiência deste teste é possuir um baixo poder quando o número de estudos que compõem a metanálise é pequeno. Por outro lado, quando o número de estudos é muito grande, ele pode detectar uma falsa heterogeneidade (Higgins e Thompson, 2002). 4.3. Estatística I2 A estatística I2 foi proposta por Higgins e Thompson como uma forma mais direta de verificar a existência de heterogeneidade através de proporção. A estatística I2 é dada por I2 = Q − ( J − 1) × 100% Q Note que a estatística I2 pode variar de valores negativos até 100%. Quando o valor for negativo ele é igualado a 0. A significância de I2 é equivalente a significância de Q. Higgins et al. (2003) sugerem uma escala em que um valor de I2 próximo a 0% indica não heterogeneidade entre os estudos, próximo a 25% indica baixa heterogeneidade, próximo a 50% indica heterogeneidade moderada e próximo a 75% indica alta heterogeneidade entre os estudos. 5. Forest plot O forest plot é um gráfico que mostra informações individuais de cada estudo incluído na metanálise e também da medida metanalítica. Para cada estudo o gráfico apresenta a medida de efeito e seu intervalo de confiança, sendo que a medida de efeito é representada por um símbolo que pode, por exemplo, ser um quadrado, um círculo, ou outra figura dependendo do software. O tamanho deste símbolo é proporcional ao peso do estudo na metanálise, quanto maior o peso, maior o tamanho do símbolo da medida de efeito. Também é exibida em torno da medida de efeito uma linha horizontal que é o seu intervalo de confiança, sendo que quanto maior esta linha, maior é a variabilidade dentro do estudo. Exemplos de forest plots serão apresentados nos Capítulos 7 e 8. 27 6. Escolha do modelo A escolha de qual modelo é o mais adequado a ser utilizado não é trivial. Não existe uma regra de escolha, mas alguns critérios devem ser considerados. O modelo de efeito fixo é adequado quando acreditamos que o efeito de tratamento é idêntico entre os estudos, quando o objetivo for estimar um efeito de tratamento para uma população específica e não extrapolar para outras populações. Já o modelo de efeitos aleatórios pode ser utilizado quando o pesquisador combina vários estudos que tem o mesmo objetivo, mas que não foram conduzidos da mesma maneira, por exemplo. Neste caso, é possível extrapolar para outras populações, o que torna a análise mais abrangente. Embora o modelo de efeitos aleatórios possa parecer melhor por ser mais abrangente, devem ser tomados alguns cuidados. Se o número de estudos for muito pequeno, a estimativa da variância entre os estudos não terá uma boa precisão. Para resolver este problema existem várias opções, algumas delas são: relatar os efeitos separados e não como uma medida resumo, já que com um número pequeno de estudos não se deve fazer conclusões sobre a medida de efeito e seu intervalo de confiança; outra opção seria utilizar um modelo de efeito fixo, lembrando das suas limitações de não fazer inferências para outras populações; e uma terceira opção seria usar uma abordagem Bayesiana, onde a estimativa da variância entre os estudos é baseada em dados não só dos estudos utilizados, mas em dados externos. Quanto à heterogeneidade, ela ajuda na escolha do modelo, mas não é determinante, maiores detalhes poderão ser vistos na Seção 7.3, cujo exemplo serve para mostrar que não devemos apenas olhar o teste de heterogeneidade e conduzir uma metanálise de olhos fechados. 7. Metanálise no STATA O STATA é um software de estatística que possui vários métodos metanalíticos disponíveis. As análises no STATA são feitas através de sua linha de comando. Alguns destes comandos devem ser instalados. Para metanálise os comandos disponíveis são metan que é o comando usado para fazer metanálises, metareg que é usado para fazer modelos de regressão em metanálises, metacum 28 que faz metanálises cumulativas e metainf que é usado para verificar a influência individual de um estudo na metanálise (Egger, 2001). Nos exemplos que serão apresentados, ainda neste capítulo, será usado o comando metan. É possível obter maiores informações sobre os outros comandos citados no menu Help do STATA, clicando em Help, em seguida em Contents e na janela que abrirá, em Command digitar o nome do comando que se quer obter mais informações. 7.1. Comando metan Para instalar o comando metan, abra o STATA clique no menu Help. Em seguida clique na opção SJ and User-written Programs, na janela que abrir clique em Stata Journal e procure o sj8-1, clique em sbe24_2 e então clique no local indicado para instalar e o metan já estará disponível no STATA. Depois de instalado o comando metan, é possível obter informações sobre ele conforme descrito anteriormente. Com o comando metan é possível fazer metanálises baseadas em modelos de efeito fixo ou modelos de efeitos aleatórios. • Opções para modelos de efeito fixo: - fixed: é o default. Ele utiliza o método de Mantel-Haenszel para variáveis binárias e o método do inverso da variância para variáveis contínuas; - fixedi: utiliza o método do inverso da variância. Está disponível apenas para variáveis binárias; - peto: utiliza o método de Peto para calcular odds ratios. Este também está disponível apenas para variáveis binárias. • Opções para modelos de efeitos aleatórios: - random: utiliza o método de DerSimonian e Laird com estimação de heterogeneidade pelo método de Mantel-Haenszel; - randomi: utiliza o método de DerSimonian e Laird com estimação de heterogeneidade pelo método do inverso da variância, este não está disponível para variáveis contínuas. • Opções para medidas de efeito: - rr: risco relativo; 29 - or: odds ratio; - rd: redução absoluta do risco; - cohen, hedges, glass: são os três métodos diferentes de calcular a diferença padronizada entre médias; - nostandard: diferença absoluta entre médias. 7.2. Exemplo: comparação de dois grupos com dados binários A Tabela 7.1 apresenta dados de 22 ensaios clínicos randomizados sobre o uso de estreptoquinase intravenosa na prevenção de mortes por infarto do miocárdio. Os dados deste exemplo foram retirados de Egger, 2001. Tabela 7.1 – Estreptoquinase intravenosa no infarto do miocárdio Estudo Fletcher Dewar 1st European Heikinheimo Italian 2nd European 2nd Frankfurt 1st Australian NHLBI SMIT Valere Frank UK Collaborative Klein Austrian Lasierra N German Witchitz 2nd Australian 3rd European ISAM GISSI-1 ISIS-2 Ano da publicação 1959 1963 1969 1971 1971 1971 1973 1973 1974 1975 1975 1976 1976 1977 1977 1977 1977 1977 1977 1986 1986 1988 Grupo tratado Grupo controle Morte Morte 1 4 20 22 19 69 13 26 7 11 6 48 4 37 1 63 5 25 25 54 628 791 Total 12 21 83 219 164 373 102 264 53 49 55 302 14 352 13 249 32 112 156 859 5860 8592 4 7 15 17 18 94 29 32 3 9 6 52 1 65 3 51 5 31 50 63 758 1029 Total 11 21 84 207 157 357 104 253 54 42 53 293 9 376 11 234 26 118 159 882 5852 8595 30 Etapa 1: a primeira etapa para se realizar uma metanálise destes dados no STATA é digitar os dados no editor de dados. Para isto, vá no menu Data e clique em Data editor. Isto fará abrir uma planilha onde serão digitados os dados conforme Figura 7.1. Também podem ser importados diretamente arquivos em outros formatos como em ASCII ou Excel. Figura 7.1 – Editor de dados do STATA Na primeira coluna foram digitados os nomes dos estudos, na segunda o ano de publicação, as colunas mortet e mortec apresentam o número indivíduos que morreram no grupo tratamento e no grupo controle, respectivamente. Finalmente, as colunas e totalt e totalc apresentam os totais de indivíduos de cada grupo. Etapa 2: para análises de estudos que comparam dois grupos quanto a uma variável binária, o comando metan requer variáveis que expressem o número de indivíduos que respondeu e que não respondeu em cada um dos grupos. Como na Tabela 7.1 são expressos apenas o número de mortes e o número total de cada grupo, é necessário que sejam criadas variáveis com os indivíduos que sobreviveram em cada grupo, fazendo a diferença do total pelo número de mortes através do comando generate digitado na linha de comando, conforme segue: generate sobreviveramt = totalt - mortet generate sobreviveramc = totalc – mortec 31 Note que os nomes sobreviveramt e sobreviveramc foram escolhidos pelo analista podendo ser qualquer nome de sua escolha. Note, ainda, que as duas novas variáveis aparecem automaticamente na planilha de dados como mostra a Figura 7.2. Figura 7.2 – Editor de dados do STATA depois do uso do comando generate Etapa 3: o primeiro passo da metanálise é definir a medida de efeito que será utilizada. Neste exemplo será utilizado o risco relativo, mas poderíamos escolher outra medida para dados binários dependendo dos delineamentos dos estudos envolvidos. Dada a medida de efeito escolhida, o segundo passo é verificar sua variabilidade entre e dentre os estudos. Para isto, indicamos o forest plot e o teste de heterogeneidade utilizando a estatística I². Na linha de comando digitamos: metan mortet sobreviveramt mortec sobreviveramc, rr label(namevar=estudo) label(namevar=estudo) é uma opção para que o nome dos estudos apareça na análise e no gráfico. Esta opção não é uma obrigatoriedade, se ela não for usada, os estudos serão numerados para serem identificados. Este comando gera o resultado da metanálise com modelo de efeito fixo pelo método de Mantel-Haenszel. Lembre que este é o modelo padrão do STATA e que se alguma outra opção de modelo, descrita na seção anterior, fosse desejável esta deveria estar no comando. 32 Este resultado é apresentado na Figura 7.4. O respectivo forest plot também é produzido conforme apresentado na Figura 7.3. Figura 7.3 – Forest plot no STATA para estreptoquinase intravenosa no infarto do miocárdio Analisando o gráfico e o teste Q que apresentou um valor p = 0,084 (circulado em vermelho), que aceita a hipótese nula de homogeneidade, isto é, que não se têm evidências para afirmar que os estudos são heterogêneos, podemos perceber que não existe heterogeneidade ou ela é muito baixa (I² = 30,9%, circulado em verde), com isso podemos optar por uma metanálise com modelo de efeito fixo. Etapa 4: a última etapa é a análise dos resultados do modelo escolhido. Este exemplo ilustra a situação em que o modelo escolhido é o mesmo modelo padrão utilizado pelo 33 STATA que é o modelo de efeito fixo pelo método de Mantel-Haenszel. O método de MantelHaenszel foi escolhido pois alguns estudos apresentam tamanhos de amostra muito pequenos. Figura 7.4 – Metanálise no STATA para estreptoquinase intravenosa no infarto do miocárdio Assim como na Figura 7.3, a saída de resultados do STATA mostra o risco relativo, seu intervalo de confiança e o peso atribuído em percentual para cada estudo, assim como, a medida metanalítica (circulada em azul) e seu intervalo de confiança. O teste de heterogeneidade que aparece na Figura 7.3 também aparece na saída Figura 7.4. Na última linha da saída de resultados, aparece ainda o teste para o risco relativo, que tem como hipótese nula RR=1 (os riscos do grupo tratamento e controle são iguais), com um valor p=0,000 (circulado em amarelo), a hipótese nula foi rejeitada, o risco não é o mesmo para o grupo tratamento e o grupo controle. 34 Tanto a saída da análise quanto o gráfico mostram que existe o efeito da estreptoquinase na prevenção de morte por infarto do miocárdio. A metanálise é dominada pelos estudos GISSI-1 e ISIS-2, que contribuem com 76,2% do peso da análise. Observações: note que no canto inferior esquerdo da Figura 7.4 estão as variáveis do editor de dados e que depois que rodamos o comando metan, seis novas variáveis foram criadas. São elas: • _SS: tamanho da amostra do estudo; • _ES: medida de efeito; • _selogES: erro padrão dos logaritmos; • _LCI: limite inferior do intervalo de confiança da medida de efeito; • _UCI: limite superior do intervalo de confiança da medida de efeito; • _WT: peso do estudo em percentual. No editor de dados, essas variáveis aparecem em seis novas colunas, conforme Figura 7.5 a seguir. Figura 7.5 – Editor de dados do STATA depois do uso do comando metan 35 7.3. Exemplo: comparação de dois grupos com dados contínuos Na Tabela 7.2 estão os dados de 9 ensaios clínicos randomizados que tem por objetivo comparar dois anestésicos diferentes usados em pequenas cirurgias quanto ao tempo de recuperação dos pacientes, no qual quanto mais rápida a recuperação, melhor é o anestésico. O tempo de recuperação é o tempo em minutos contado do momento em que os gases anestésicos são desligados até o momento em que o paciente abre os olhos. Para atender a suposição de normalidade dos dados, os tempos foram transformados para escala logarítmica. Os dados deste exemplo foram retirados de Whitehead, 2002. O número total de pacientes submetidos a cada um dos tipos de anestésicos, a média do tempo de recuperação e o desvio padrão de cada grupo são apresentadas na Tabela 7.2. Tabela 7.2 – Tempo (em escala logarítmica) de recuperação de pacientes submetidos aos anestésicos A e B Estudo Anestésico A Desvio Nº de Média Padrão pacientes Anestésico B Nº de pacientes Média Desvio Padrão 1 4 1,141 0,967 5 0,277 0,620 2 10 2,165 0,269 10 1,519 0,913 3 17 1,790 0,795 17 1,518 0,849 4 8 2,105 0,387 9 1,189 1,061 5 7 1,324 0,470 10 0,456 0,619 6 11 2,369 0,401 10 1,550 0,558 7 10 1,074 0,670 12 0,265 0,502 8 5 2,583 0,409 4 1,370 0,934 9 14 1,844 0,848 19 2,118 0,749 Etapa 1: os dados foram digitados no STATA conforme Figura 7.6. Na coluna estudo estão os números dos estudos, n_a e n_b são o número total de pacientes submetidos ao uso do anestésico A e ao anestésico B, respectivamente, M_A e M_B são as médias do tempo de recuperação (em escala logarítmica) dos pacientes submetidos ao uso dos anestésicos A e B e DP_A e DP_B são os desvios padrão dos tempos de recuperação dos pacientes que usaram os anestésicos A e B. 36 Figura 7.6 – Editor de dados do STATA Etapa 2: o primeiro passo da metanálise é definir a medida de efeito que será usada, neste exemplo usaremos uma medida de efeito para dados contínuos e a medida usada será a diferença absoluta entre médias, pois todos os estudos mediram o tempo de recuperação dos pacientes na mesma escala. O segundo passo é verificar a variabilidade entre e dentro dos estudos, para isto, devemos olhar o forest plot e o teste de heterogeneidade. Na linha de comando digitamos: metan n_a M_A DP_A n_b M_B DP_B, nostandard Lembrando que nostandard é a opção para o uso da diferença absoluta de médias. O forest plot gerado por esse comando é de uma metanálise com modelo de efeito fixo pelo método do inverso da variância, já que não foi definido nenhum outro e este é o padrão do STATA para dados contínuos. 37 Figura 7.7 – Forest plot no STATA para diferença absoluta das médias dos anestésicos A e B com modelo de efeito Analisando o gráfico e o teste Q que apresentou um valor p = 0,044 (circulado em vermelho), que rejeita a hipótese nula de homogeneidade, o que significa que temos evidências para afirmar que os estudos são heterogêneos, podemos verificar que a heterogeneidade pode ser considerada moderada através da estatística I² = 49,7% (circulada em verde), com isso podemos optar por uma metanálise com modelo de efeito aleatório ou indo além na observação do gráfico, podemos verificar que apenas o estudo 9 está bem diferente dos demais. O pesquisador poderia desconfiar de que há alguma falha no estudo 9 ou que ele tem características distintas dos demais e que isso passou despercebido pela revisão sistemática, o pesquisador deve investigar melhor e se descobrir alguma divergência, pode retirar este estudo da análise ou se não encontrar nada de anormal ou muito diferente, o estudo deve permanecer na metanálise. Vale salientar que não encontrando evidências de que o estudo tem características distintas dos demais, ele não pode ser retirado da metanálise só porque apresentou resultados diferentes. Apenas para verificar o que aconteceria se retirássemos o estudo 9 da nossa metanálise, geramos o forest plot sem ele, conforme Figura 7.8 a seguir. 38 Figura 7.8 – Forest plot no STATA para diferença absoluta das médias dos anestésicos A e B com modelo de efeito fixo sem o estudo 9 Podemos perceber com este novo gráfico e com a estatística I² que agora os estudos são homogêneos e que o estudo 9 era o que causava a heterogeneidade. A partir de agora devemos escolher, conduzir uma metanálise com modelo de efeito fixo, pois o peso do estudo 9 é baixo e poderíamos pensar que ele não interfere muito nos dados da metanálise, ou conduzir a metanálise com um modelo de efeitos aleatórios com o estudo 9. Ou ainda, se fosse comprovado que o estudo 9 apresenta características distintas dos demais, ele poderia ser retirado e a metanálise conduzida com modelo de efeito fixo, já que os demais estudos são homogêneos. Neste exemplo vamos conduzir a metanálise sem tirar o estudo 9, pois não temos conhecimento suficiente de que ele difere dos demais, portanto não podemos retirá-lo e utilizar um modelo de efeitos aleatórios, pois existe uma heterogeneidade moderada e achamos conveniente usar este modelo. Que fique claro para o leitor que outra escolha poderia ter sido feita, é uma escolha que cabe ao especialista da área. 39 Etapa 3: neste exemplo o modelo escolhido para a metanálise com modelo de efeitos aleatórios, usamos o comando metan da seguinte maneira: metan n_a M_A DP_A n_b M_B DP_B, nostandard random Um novo forest plot é gerado conforme Figura 7.9, a diferença dele para o primeiro da Figura 7.7, é que neste já estamos conduzindo a metanálise com modelo de efeitos aleatórios, o que faz com que os pesos sejam calculados de maneira diferente. Figura 7.9 – Forest plot no STATA para diferença absoluta das médias dos anestésicos A e B com modelo de efeitos aleatórios A saída de análises do STATA está na Figura 7.10, a seguir: 40 Figura 7.10 – Metanálise no STATA para diferença das médias dos anestésicos A e B A saída do STATA mostra a diferença absoluta entre médias (WMD), seu intervalo de confiança e o peso atribuído em percentual para cada estudo, assim como, a medida metanalítica (circulada em azul) e seu intervalo de confiança. O teste de heterogeneidade Q e a estatística I² também aparecem, e já foram analisados no forest plot. Note que uma estimativa para o τ2 aparece (circulada em laranja), pois este é um modelo de efeitos aleatórios e ele possui variabilidade entre os estudos. Na última linha, aparece ainda o teste para a diferença absoluta entre médias, que tem como hipótese nula WMD=0 (as médias dos dois tratamentos são iguais), com um p=0,000 (circulado em amarelo), a hipótese nula foi rejeitada, a média do tempo de recuperação dos dois anestésicos não é igual. Tanto a saída da análise quanto o gráfico mostram que o tempo de recuperação dos pacientes submetidos ao anestésico A é maior que o tempo de recuperação dos pacientes submetidos ao anestésico B. 7.4. Exemplo: um grupo com dados binários A Tabela 7.3 apresenta dados de 7 estudos sobre a eficácia no uso de um determinado diurético para controle da pressão arterial. Em cada estudo todos os pacientes apresentavam pressão alta, foram medicados com o diurético e sua pressão medida após uma hora. No grupo evento foram contados os casos que apresentaram pressão normal após o uso do diurético, ou seja, o número de pacientes nos quais o uso do diurético foi eficaz e no grupo não evento são 41 os pacientes que permaneceram com pressão alta após o uso do diurético. Foi considerada alta, a pressão maior que 140/90 mmHg. Tabela 7.3 – Diminuição da pressão arterial com uso de um diurético Estudo Evento Não evento 1 231 25 2 265 33 3 62 9 4 114 11 5 157 27 6 106 16 7 163 15 Etapa 1: os dados foram digitados no STATA conforme figura 7.11. Figura 7.11 – Editor de dados do STATA Na primeira coluna foram digitados os números dos estudos, na segunda a variável evento que é número de pacientes que apresentou pressão normal após o uso do diurético e naoevento é a variável que representa o número de pacientes que permaneceu com pressão alta após o uso do diurético. Etapa 2: para análises de estudos para um grupo com dados binários, o comando metan requer as medidas de efeito de cada estudo e suas respectivas variâncias. Neste exemplo vamos usar odds como medida de efeito, portanto, vamos gerar no STATA essas 42 variáveis através do comando generate. Para gerar o logaritmo do odds usaremos a expressão (2.1) e para sua variância a expressão (2.2). generate lnodds = ln(evento/ naoevento) generate var = 1/ evento+1/ naoevento As duas novas variáveis aparecem automaticamente na planilha de dados como mostra a Figura 7.12. Figura 7.12 – Editor de dados do STATA depois do uso do comando generate Etapa 3: podemos agora gerar o forest plot para verificar a presença ou não de heterogeneidade entre os estudos. Quando os dados são de um grupo o comando metan é utilizado da seguinte maneira: metan lnodds var, eform No comando metan primeiro é colocada a medida de efeito, seguida da sua variância. A opção eform é utilizada para os dados saírem na escala original e não em logaritmo, para as medidas que não utilizam a escala logarítmica, esta opção não é necessária. O forest plot gerado é apresentado na Figura 7.13. 43 Figura 7.13 – Forest plot no STATA para pressão arterial com modelo de efeito fixo Através da Figura 7.13 é possível analisar o forest plot e verificar que o teste Q apresentou um valor p = 0,000 (circulado em vermelho), que rejeita a hipótese nula de homogeneidade, o que significa que se tem evidências de que os estudos são heterogêneos. Através da estatística I² = 93,8% (circulada em verde), pode-se perceber que existe uma alta heterogeneidade entre os estudos. Com isso podemos optar por uma metanálise com modelo de efeitos aleatórios. Etapa 4: para gerar uma metanálise com modelo de efeitos aleatórios para um grupo com variável binária, o comando é o seguinte: metan lnodds var, randomi eform Um novo forest plot é gerado com o modelo de efeitos aleatórios, conforme Figura 7.14. 44 Figura 7.14 – Forest plot no STATA para pressão arterial com modelo de efeitos aleatórios Figura 7.15 – Metanálise no STATA para pressão arterial 45 A saída do STATA mostra a medida de efeito, neste caso o odds, de cada estudo, seu intervalo de confiança e o peso atribuído em percentual para cada estudo, assim como, a medida metanalítica (circulada em azul) e seu intervalo de confiança. O teste de heterogeneidade Q e a estatística I² também aparecem, e já foram analisados no forest plot. A estimativa para o τ2 aparece (circulada em laranja), pois este é um modelo de efeitos aleatórios e ele possui variabilidade entre os estudos. Na última linha da saída de resultados, aparece ainda o teste para a medida de efeito, neste caso o odds, que tem como hipótese nula odds=1 (a probabilidade de ocorrer o evento e não ocorrer é a mesma). Com um p=0,000 (circulado em amarelo), a hipótese nula foi rejeitada, ou seja, a probabilidade de ocorrer o evento é significativamente diferente da probabilidade de não ocorrer o evento. Baseados nos 7 estudos da metanálise estima-se que o odds de baixar a pressão seja 8,055, para pacientes que fazem o tratamento 8,055 a cada 1 paciente tem o efeito desejado (baixar a pressão). 8. Metanálise no R O R é um software estatístico programável, ele é livre e pode ser obtido diretamente do site www.r-project.org. O R possui alguns pacotes básicos que já vem instalados juntamente com o programa e outros que são colaborações que o software recebe. Estes devem ser instalados separadamente, como é o caso do pacote que será utilizado neste trabalho chamado metafor que é um dos pacotes disponíveis atualmente para metanálises. Existem outros pacotes para metanálise no R que podem ser baixados como meta, metacor e metaMA. Para instalar um pacote que não vem previamente instalado no R, no menu Pacotes clique em Instalar pacote(s) selecione o CRAN mirror que é o local de onde será baixado o pacote, na janela Packages que irá abrir, procure o pacote metafor, ele será instalado. Para começar a usar o metafor, ou qualquer outro pacote que for instalado separadamente, é necessário carregá-lo, no menu Pacotes clique na opção Carregar pacote procure o pacote metafor, então ele será carregado e estará pronto para ser usado. 8.1. Pacote metafor O pacote metafor possui funções para conduzir metanálises no R. Estão disponíveis modelos de efeito fixo e efeitos aleatórios. Os métodos de Mantel-Haenszel e de Peto estão disponíveis para modelos de efeito fixo. Alguns gráficos como forest, funnel e radial plots também podem ser feitos com o pacote metafor. Também é possível fazer modelos de meta-regressão com este pacote. 46 Os exemplos do capítulo anterior serão feitos novamente neste capítulo apenas para mostrar como conduzir uma metanálise no R, por isso serão mostrados apenas os comandos e as saídas do R, pois as conclusões são as mesmas, o exemplo da Seção 7.4 não será feito com o R, pois com o comando metafor não é possível conduzir metanálises para um grupo com dados binários. 8.2. Exemplo: comparação de dois grupos com dados binários Este exemplo se refere ao mesmo exemplo da Seção 7.2, os dados utilizados serão os mesmos e não serão repetidos nesta seção. Os dados da Tabela 7.1 são introduzidos no R da seguinte forma: a=c(1,4,20,22,19,69,13,26,7,11,6,48,4,37,1,63,5,25,25,54,628,791) na=c(12,21,83,219,164,373,102,264,53,49,55,302,14,352,13,249,32,112,156,859, 5860,8592) c=c(4,7,15,17,18,94,29,32,3,9,6,52,1,65,3,51,5,31,50,63,758,1029) nc=c(11,21,84,207,157,357,104,253,54,42,53,293,9,376,11,234,26,118,159,882,5852, 8595) b=na-a d=nc-c onde a e c são os indivíduos que morreram no grupo tratamento e controle respectivamente, na e nc são todos os indivíduos do grupo tratamento e controle, b e d são os indivíduos que sobreviveram no grupo tratamento e controle. Os dados também podem ser importados de outros arquivos em formato txt. Para importar dados de Excel, por exemplo, o arquivo deve ser salvo em formato “Texto (separado por tabulações)” e no R deve ser digitado o seguinte comando dados = read.table(“C:/exemplo/dados.txt”) O programa irá ler o arquivo dados do caminho especificado, neste caso o arquivo estava no diretório C, na pasta exemplo. Para conduzir uma metanálise com modelo de efeito fixo com o método de MantelHaenszel conforme feito no STATA anteriormente, o comando no R é o seguinte: rma.mh(a,b,c,d,na,nc,measure="RR") 47 A medida que está sendo usada também deve ser indicada, neste caso RR (risco relativo). A saída do R é a seguinte: Figura 8.1 – Metanálise com modelo de efeito fixo no R O forest plot no R é gerado pelo seguinte comando: forest(rma.mh(a,b,c,d,na,nc,measure="RR")) 48 Figura 8.2 – Forest plot no R Note que as medidas de efeito e os intervalos de confiança não são os mesmos dados pelo STATA na Figura 7.3, pois para o risco relativo, o R apresenta os dados em escala logarítmica e o STATA na escala original. 8.3. Exemplo: comparação de dois grupos com contínuos Este exemplo se refere ao mesmo exemplo da Seção 7.3, os dados utilizados serão os mesmos e não serão repetidos nesta seção. Os dados da Tabela 7.2 são introduzidos no R da seguinte forma: nA=c(4,10,17,8,7,11,10,5,14) mA=c(1.141,2.165,1.790,2.105,1.324,2.369,1.074,2.583,1.844) dpA=c(0.967,0.269,0.795,0.387,0.470,0.401,0.670,0.409,0.848) 49 nB=c(5,10,17,9,10,10,12,4,19) mB=c(0.277,1.519,1.518,1.189,0.456,1.550,0.265,1.370,2.118) dpB=c(0.620,0.913,0.849,1.061,0.619,0.558,0.502,0.934,0.749) onde nA e nB são o número total de pacientes submetidos ao uso do anestésico A e ao anestésico B, respectivamente, mA e mB são as médias do tempo de recuperação (em escala logarítmica) dos pacientes submetidos ao uso dos anestésicos A e B e dpA e dpB são os desvios padrão dos tempos de recuperação dos pacientes que usaram os anestésicos A e B. Para conduzir uma metanálise com modelo de efeitos aleatórios conforme feito no STATA anteriormente, pelo método de DerSimonian e Laird, como medida de efeito a diferença absoluta entre médias, o comando no R é o seguinte: rma(n1i=nA,n2i=nB,m1i=mA,m2i=mB,sd1i=dpA,sd2i=dpB,measure="MD",method= "DL") A saída do R é a seguinte: Figura 8.3 – Metanálise com modelo de efeitos aleatórios no R 50 O forest plot é feito com o comando: forest(rma(n1i=nA,n2i=nB,m1i=mA,m2i=mB,sd1i=dpA,sd2i=dpB,measure="MD", method="DL")) Figura 8.4 – Forest plot no R 9. Considerações finais Esta monografia abordou as questões básicas de uma metanálise, como as medidas de efeito mais utilizadas na área da saúde e os modelos de efeito fixo e de efeitos aleatórios que foram, também, descritos. Noções de como identificar heterogeneidade entre os estudos e de como escolher o modelo a ser utilizado foram abordadas. Este trabalho atingiu o objetivo de servir como um guia prático para pessoas que queiram conduzir uma metanálise básica, já que não existem materiais neste formato em português. Mostrar a utilização de dois softwares foi um ponto relevante deste trabalho, pois nem todo mundo tem acesso ao STATA que é um software pago, já o R é um software livre e qualquer um pode instalá-lo. Existem outras técnicas utilizadas em metanálises que não foram abordadas neste trabalho como, por exemplo, abordagem bayesiana, análise de subgrupo e meta-regressão. As duas últimas são duas importantes formas de explorar a heterogeneidade, informações sobre estas técnicas podem ser vistas em Sutton, 2000. 51 Referências Bibliográficas BORENSTEIN, M.; HEDGES, L. V.; HIGGINS, J. P .T., ROTHSTEIN, H. R. Introduction to Meta-Analysis, John Wiley & Sons, 2009. BROCKWELL, S. E.; GORDON, R. A comparison of statistical methods for meta-analysis. Statistics in Medicine, v. 20, n. 6, p. 825-840, 2001. EGGER, M.; SMITH, G. D.; ALTMAN, D. G. Systematic reviews in health care: Metaanalysis in context. BMJ, 2001. FLETCHER, R. H.; FLETCHER, S. W. Epidemiologia clínica: elementos essenciais; tradução Roberta Marchiori Martins. Porto Alegre, Artmed, 2006. GLASS, G. V. Primary, secondary, and meta-analysis of research. Educational Researcher. V. 5, p. 3-8, 1976. HEDGES, L. V.; OLKIN I. Statistical Methods for Meta-Analysis. Academic Press. 1985. KULINSKAYA, E.; MORGENTHALER, S.; STAUDTE R. G. Meta Analysis: A guide to calibrating and combining statistical evidence. John Wiley & Sons, 2008. LEANDRO, G. Meta-analysis in medical research: The handbook for the understanding and practice of meta-analysis. London: BMJ Books, 2005. MARTINEZ, E. Z. Metanálise de ensaios controlados aleatorizados: aspectos quantitativos. Revista Medicina (Ribeirão Preto), v. 40, n.2 p. 223-235, 2007. MARTINEZ, E. Z.; MAZIN S. C. Modelos Estatísticos em Metanálises. 54ª RBRAS, 13º SEAGRO, São Carlos, 2009. NORMAND, S. L. T. Meta-analysis: formulating, evaluating, combining, and reporting. Statistics in Medicine, v. 18, p. 321-359, 1999. NUNES, L. N. Meta-análise. Porto Alegre, 1997. 52 PEARSON, K. Report on certain enteric fever inoculation statistics. British Medical Journal, v 3, p.1243-1246, 1904. SUTTON, A. J.; ABRAMS, K. R.; JONES, D. R.; SHELDON, T. A.; SONG, F. Methods for Meta-Analysis in Medical Research. John Wiley & Sons. 2000. VIECHTBAUER, W. Meta-Analysis Package for R, 2009. WHITEHEAD, A. Meta-analysis of controlled clinical trials. John Wiley & Sons. 2002. YATES, F.; COCHRAN, W. G. The analysis of groups of experiments. The Journal of Agricultural Science, v. 28, n. 4, p. 556-580, 1938. 53