Estudios Exp PDF
Estudios Exp PDF
Estudios Exp PDF
profesión
Artículo especial
Estudios experimentales
Experimental studies
Begoña Bermejo Fraile
Médica. Doctora en Metodología de Investigación Biomédica. Servicio de Docencia, Investigación y Desarrollo Sanitarios.
Departamento de Salud del Gobierno de Navarra
RESUMEN ABSTRACT
Este artículo describe los aspectos esenciales en el diseño y análisis This article presents the basical aspects in experimental studies design
de los estudios experimentales: selección de pacientes, distribución and analysis: patient recruitment, randomization, blinding, follow-up,
aleatoria, enmascaramiento, seguimiento, análisis de los datos y pre- data analysis and presentation of results. Quasi-experimental studies
sentación de resultados. Se describen también los estudios cuasiex- and the main bias they can carry are also described.
perimentales y los principales sesgos que conllevan.
Palabras clave: estudios experimentales, estudios cuasiexperimen- Key words: experimental studies, quasi-experimental studies.
tales.
Correspondencia: Bermejo Fraile B. Estudios experimentales. Matronas Prof. 2008; 9 (1): 15-20
Begoña Bermejo Fraile
Correo electrónico: [email protected]
15
Población
Criterios de selección Consentimiento informado
Participantes
Asignación aleatoria
Grupo intervención Grupo control
Pérdidas Pérdidas
No cumplidores Enmascaramiento No cumplidores
Reacciones adversas Reacciones adversas
Estos criterios son más o menos restrictivos en una cardiópatas, broncópatas, etc. y en tratamiento médico
búsqueda de equilibrio entre la validez interna y la vali- por cualquier patología. Las conclusiones del estudio fue-
dez externa. La validez interna se refiere al hecho de que ron muy válidas, pero difícilmente extrapolables, ya que
los resultados del estudio no están sesgados y se llega a son pocos los mayores de 65 años que no están en trata-
unas conclusiones correctas, válidas. La validez externa miento médico o no presentan alguna patología.
es la capacidad de extrapolación de esos resultados, te-
niendo en cuenta que sólo se pueden generalizar unos
resultados «válidos» a una población que, en los aspec- TAMAÑO DE LA MUESTRA
tos relevantes, es de similares características a la muestra En estadística, el tamaño de la muestra actúa como una
de estudio. lupa: si se estudian muchos individuos, cualquier pe-
Imaginemos que se trata de un ensayo clínico en el que queña diferencia resulta estadísticamente significativa y,
se quieren comparar diferentes formas de tratamiento de en cambio, cuando el tamaño de la muestra es pequeño
la anemia ferropénica durante el embarazo. Los criterios grandes diferencias pueden no resultar estadísticamente
de selección en principio son: mujer embarazada y con significativas. Aquí es importante recalcar que una aso-
anemia ferropénica. Pero dentro de este grupo de muje- ciación estadísticamente significativa no quiere decir
res, puede haber algunas que presentan contraindicacio- que sea clínicamente relevante. La «p» no proporciona
nes para el tratamiento con hierro o intolerancia, pueden en absoluto una medida de la magnitud del efecto. Una
presentar otras enfermedades o tratamientos que interfie- p=0,001 no quiere decir que el efecto sea mayor que si
ran con el hierro, o pueden estar siguiendo una dieta es- ha resultado p=0,78.
pecial que modifica la efectividad del tratamiento. Con
el fin de aumentar la validez del estudio, y que nada aje- Ejemplo: Se comprueba en un estudio pequeño que
no al tratamiento interfiera con los resultados, se puede un medicamento disminuye la presión arterial diastóli-
decidir excluir a estas mujeres, siempre que no constitu- ca de media 30 mmHg, no resultando estas diferencias
yan un número muy elevado, que provoque que al final estadísticamente significativas (p=0,32). En cambio, en
los resultados del estudio sólo se pudieran generalizar a otro estudio con un número de pacientes muchísimo
un sector muy pequeño de la población. mayor, se observa que otro medicamento disminuye la
presión arterial diastólica de media 6 mmHg, siendo
Ejemplo: Se llevó a cabo un ensayo clínico para compa- estas diferencias estadísticamente significativas (p=0,01).
rar la efectividad de dos fármacos para la prevención de Así, a simple vista, ¿cuál parece mejor fármaco para la
la demencia senil. Los criterios de inclusión eran perso- hipertensión? Estudiar pocos sujetos no sirve de mu-
nas mayores de 65 años no diagnosticados de demencia. cho, pero estudiar muchos tampoco. ¿Cuántos pacientes
Con el fin de que los fármacos que se probaban no inter- estudiar? Los necesarios para que una diferencia clínica-
firiesen con otros tratamientos o enfermedades, se exclu- mente relevante, si existe, resulte estadísticamente signifi-
yeron los pacientes hipertensos, hipercolesterolémicos, cativa.
16
Hay todo un abanico de fórmulas para responder a es- enmascarar el tratamiento, es decir, que los sujetos no
ta pregunta, todas ellas cargadas de una gran subjetivi- sepan qué es lo que están tomando: si el fármaco que se
dad (cuál es esa diferencia clínicamente relevante, cuál evalúa, otro fármaco o un placebo.
es la variabilidad, con qué error alfa y qué potencia), con Pero también el investigador puede transmitir su en-
lo que se termina concluyendo que el cálculo del tama- tusiasmo o escepticismo a sus pacientes, su confianza
ño de la muestra es, fundamentalmente, una cuestión de en que un determinado tratamiento vaya bien. Para evi-
sentido común: si el evento que se quiere estudiar es po- tar este sesgo del investigador, es preferible que éste
co frecuente (incidencia de malformaciones congénitas) tampoco conozca a qué grupo pertenece el paciente,
será necesario estudiar más pacientes que si el evento es qué tratamiento está tomando.
relativamente frecuente, por ejemplo cesáreas. Incluso es conveniente que quien realiza el análisis es-
tadístico tampoco conozca el grupo de tratamiento,
simplemente compara el grupo A con el B, porque si lo
ASIGNACIÓN ALEATORIA sabe «se pueden estrangular los datos hasta que confiesen».
Se lleva a cabo un ensayo clínico para ver la efectividad Si sólo es el individuo participante en el estudio
de las medidas de apoyo a la lactancia materna. Para quien desconoce el grupo en el que está es un ensayo
ello, se compara a un grupo de madres que reciben apo- simple ciego; si, además, lo desconoce el investigador,
yo con un grupo de madres que no lo reciben. doble ciego; y es triple ciego cuando además descono-
En la lactancia materna influyen variables como la cen el grupo el estadístico, la matrona, el patólogo, el
edad de la madre, nivel de estudios, situación laboral, microbiólogo, etc.
lactancias previas, etc. La única forma de ver cuál es el Enmascarar un fármaco es relativamente sencillo: se
efecto atribuible al apoyo es que los dos grupos sean si- trata de hacer un preparado que debe tener las mismas
milares en todos estos factores, y que la única diferencia características organolépticas (forma, color, olor, sabor).
sea que unas mujeres reciben apoyo y otras no, de mo- Pero, ¿cómo se enmascaran las medidas de apoyo a la
do que si es mayor la lactancia materna en el grupo que lactancia materna, la psicoterapia, o una intervención
recibe apoyo, esta diferencia sólo puede atribuirse a lo quirúrgica? No siempre es fácil el enmascaramiento, pe-
único que diferencia a los dos grupos: el recibir o no las ro tampoco imprescindible.
medidas de apoyo.
Una de las formas de conseguir que los dos grupos
sean similares es mediante el azar. Para ello, se asigna un SEGUIMIENTO
número a cada uno de los sujetos que participan en el El seguimiento de los sujetos debe ser el adecuado al
ensayo (generalmente, por orden de entrada en el estu- proceso concreto que se estudia: corto, como la admi-
dio) y, mediante el ordenador, se pueden crear tablas de nistración de uterotónicos y ver cómo se desarrolla el
números aleatorios, de modo que los números 1, 5, 8, 9 trabajo de parto, o largo, como valorar los efectos en la
y 10, por ejemplo, pertenecen a un grupo y los núme- edad adulta de la lactancia materna. A menor segui-
ros 2, 3, 4, 6 y 7 pertenecen al otro. miento, menos probables son las pérdidas en el estudio,
Esta distribución aleatoria facilita, aunque no garan- pero lo realmente importante es asegurar la comparabi-
tiza, que todas las variables que pueden influir en los lidad de los dos grupos, de modo que las pérdidas no es-
resultados del estudio (en el ejemplo, la edad de la ma- tén asociadas al desenlace que queremos estudiar. Las
dre, el nivel de estudios, la situación laboral…) se dis- pérdidas se pueden deber a ineficacia del tratamiento (el
tribuyan de igual manera en los dos grupos. Esto es así paciente se cansa y abandona), por efectos adversos, por
especialmente si se estudian muchos sujetos. De todos curación (para qué continuar), por enfermedades inter-
modos, siempre es conveniente comprobar que las ca- currentes, por un cambio de domicilio o, simplemente,
racterísticas basales de ambos grupos son similares, que por un cambio de opinión. Si en un estudio se pierden
la asignación aleatoria «ha funcionado bien». pacientes precisamente porque se curan, los que perma-
necen son los que peor han evolucionado, con lo que
llegaríamos a la conclusión (errónea, no válida, sesgada)
ENMASCARAMIENTO de que el tratamiento no es eficaz. Es preciso adoptar
Cualquier intervención (medicación, psicoterapia, in- medidas para asegurar el máximo seguimiento: informar
formación) puede producir, por simple sugestión, una a los participantes en el estudio sobre la importancia del
mejoría (o empeoramiento), que es independiente del seguimiento íntegro, tener datos para localizar al sujeto
efecto específico del tratamiento. Es lo que se denomi- o a un familiar; algunos datos incluso se pueden obtener
na «efecto placebo»; para poder contrarrestarlo, se debe por teléfono (por ejemplo, supervivencia).
17
CUMPLIMIENTO
Clofibrato Placebo
El que el individuo tome o no el tratamiento que se le
ha asignado depende, entre otros, de la forma de admi- p= 0,55
nistración, dosis, duración del tratamiento (puede ser 20,0% 20,9%
muy largo en las enfermedades crónicas). Cómo anali-
zar después a los sujetos «no cumplidores» tiene, como Cumplidores No cumplidores Cumplidores No cumplidores
veremos más adelante, importantes connotaciones me-
todológicas. 15,0% 24,6% 15,1% 28,3%
El tratamiento con hierro puede, además de ser de p <0,001 p <0,001
larga duración, producir molestias gástricas, diarrea o
estreñimiento. Si de entrada «nos aseguramos» que las
mujeres que participan en el estudio cumplirán con to- Figura 2. Análisis por intención de tratar
do el tratamiento, podemos llegar a unos resultados
muy válidos. Pero la realidad es muy distinta: nos dice frente a 24,6%). Pero cuál es nuestra sorpresa cuando
que un elevado porcentaje abandona el tratamiento de- en el grupo control, la mortalidad de los que se han to-
bido a estos efectos adversos. De entrada, seleccionar o mado el placebo también es significativamente inferior
no sujetos más probablemente cumplidores, depende a la de los que no lo han tomado. Parece que lo que dis-
de qué se valore más, si eficacia o efectividad, o de si se minuye la mortalidad es «tomar algo», aunque sea un
quieren conocer los resultados en una situación ideal o placebo.
en la situación real. La pregunta que surge es: ¿Qué característica tienen
Aquí es importante aclarar la diferencia entre eficacia los cumplidores, los que se toman el tratamiento (sin
y efectividad: eficacia es la consecución de unos objeti- saber si están tomando el fármaco o el placebo) que ha-
vos en condiciones ideales, las del laboratorio, las del ce que en ellos la mortalidad sea inferior? Podemos no
ensayo clínico; en cambio, efectividad es la consecución llegar a saberlo nunca, pero con la distribución aleatoria
de esos mismos objetivos en las condiciones reales. que se hizo en un principio, los cumplidores y todas las
connotaciones asociadas a ellos se distribuyeron por
Ejemplo: Un fármaco para la hipertensión puede ser igual en un grupo y otro. La distribución al azar facilita
realmente eficaz, disminuye significativamente la pre- que los dos grupos sean similares, no sólo en las varia-
sión arterial, pero es necesario tomar el medicamento bles que conocemos que influyen en la mortalidad co-
cuatro veces al día, y su sabor no es muy agradable. A la ronaria, sino en aquéllas que no conocemos que influ-
hora de la verdad, el paciente en muchas ocasiones se yen. Por ello, por respeto a la asignación aleatoria hecha
olvida de tomar el fármaco, con lo que, en las condicio- en un principio, se lleva a cabo un «análisis por inten-
nes reales, las de la vida diaria, ya no resulta tan efectivo ción de tratar», que consiste en analizar a los pacientes
y ya no logra disminuir la presión arterial como cuan- según el grupo al que fueron asignados (según la inten-
do, estando en el hospital y bajo las condiciones del en- ción inicial), de forma independiente de si tomaron el
sayo clínico, se le administraba el tratamiento cuatro tratamiento o no. Lógicamente, los «traspasados» redu-
veces al día. cen la potencia del estudio y las probabilidades de de-
tectar diferencias son menores, pero esta forma de ana-
lizar los datos aumenta la validez de los resultados.
ANÁLISIS POR INTENCIÓN DE TRATAR
Ejemplo: Se lleva a cabo un estudio para ver el efecto del
clofibrato sobre la mortalidad coronaria a los 5 años. PRESENTACIÓN DE RESULTADOS
Los resultados son los de la figura 2. En el grupo de clo- Las medidas de eficacia o efectividad de la intervención
fibrato la mortalidad es del 20,0% y en el grupo con- en un ensayo clínico son el riesgo relativo (RR), reduc-
trol es del 20,9%, no siendo estas diferencias estadísti- ción relativa del riesgo (RRR), reducción absoluta del
camente significativas (p=0,55). riesgo (RAR) y número que es necesario tratar (NNT).
Pero en el grupo de clofibrato, no todos los pacientes
se han tomado el fármaco, por lo que uno tiene la ten- Ejemplo: Se lleva a cabo un ensayo clínico para ver los
tación de comparar la mortalidad de los que lo han to- efectos de suplementos de cinc sobre el parto prematu-
mado con los que no lo han tomado, y se observa que ro. En el grupo de intervención, la incidencia de parto
la mortalidad en el grupo de los cumplidores es signifi- prematuro es del 3% y en el grupo control del 5% (los
cativamente inferior que la de los no cumplidores (15% datos no son reales).
18
Tabla 2. Riesgo relativo (RR), reducción relativa del riesgo (RRR), reducción absoluta del riesgo (RAR)
y número que es necesario tratar (NNT)
RR RRR RAR NNT
A 0,03/0,05 = 0,60 (0,05 – 0,03)/0,05 = 0,40 0,05 – 0,03 = 0,02 1/0,02 = 50
B 0,003/0,005 = 0,60 (0,005 – 0,003)/0,005 = 0,40 0,005 – 0,003 = 0,002 1/0,002 = 500
C 0,3/0,5 = 0,60 (0,3 – 0,5)/0,5 = 0,40 0,5 – 0,3 = 0,2 1/0,2 = 5
19
Mejoría (%)
Hawthorne (figura 3). Este sesgo recibe el nombre de
una fábrica en la que se quiso comprobar si el hecho de
mejorar la iluminación aumentaba la productividad.
Efectivamente aumentó la productividad, pero podía
deberse a la mejora en la iluminación o al hecho de que
los trabajadores, sólo por el hecho de saber que iban a
medir su productividad, la aumentaban. Si hubiese un Grupo control Grupo intervención
grupo control, el efecto Hawthorne, el hecho de sentir-
se observados, el efecto placebo o la evolución natural Mejora espontánea Efecto placebo
afectan por igual a ambos grupos, por lo que si hay di- Efecto Hawthorne Efecto específico
ferencias entre los dos grupos, ésta sólo puede atribuirse Figura 3. Sesgos en los estudios antes-después. Componentes del efecto
a lo único que los diferencia: el que uno tiene mejor total
iluminación que el otro. En el ejemplo de la lactancia,
si hay un grupo control y en el grupo de intervención ocurre con los recién nacidos de madres fumadoras en
es mayor la decisión a favor de la lactancia materna, es- comparación con los de las madres no fumadoras.
ta mejoría sólo puede ser atribuible a lo único que dife- No existe un diseño idóneo, sino aquél más adecuado
rencia a los dos grupos: el que uno recibe la informa- para dar respuesta a los objetivos del estudio.
ción sobre los efectos beneficiosos de la lactancia
materna y el otro no.
Los ensayos clínicos se encuentran en el escalón más BIBLIOGRAFÍA
alto de la evidencia científica. Es el diseño en el que me- Bakke OM, Carné X, García Alonso F. Ensayos clínicos con medicamentos.
nos cabida tienen los sesgos, por lo que suponen la forma Madrid: Mosby/Doyma Libros; 1994.
Bermejo B. Medida de los resultados sobre la salud. En: Bermejo B, ed.
idónea de valorar la eficacia o efectividad de cualquier in-
Epidemiología clínica aplicada a la toma de decisiones en medicina.
tervención sanitaria. Pero no todo es susceptible de ser Pamplona: Departamento de Salud del Gobierno de Navarra, 2001.
estudiado mediante un ensayo: nunca se nos ocurriría se- Guyatt GH, Sackett DL, Cook DJ. Evidence-Based Medicine Working
Group. Guías para usuarios de la lectura médica I. Cómo utilizar un
leccionar a un grupo de gestantes, dividirlas de manera artículo sobre tratamiento o prevención. ¿Son válidos los resultados
aleatoria en dos grupos, decirle a uno de ellos que fume, del estudio? JAMA 1993; 270: 2.598-601.
y al otro que no fume, y valorar así los efectos del tabaco Guyatt GH, Sackett DL, Cook DJ. Evidence-Based Medicine Working
Group. Guías para usuarios de la lectura médica II. Cómo utilizar un
sobre el recién nacido. En este caso, se realizaría un estu- artículo sobre tratamiento o prevención. ¿Cuáles son los resultados?
dio de cohortes, en el que simplemente observamos qué JAMA 1993; 271: 59-63.
20