Libro de Biometria Comunitaria
Libro de Biometria Comunitaria
Libro de Biometria Comunitaria
BIOMETRA
Texto Bsico de Biometra
ISSN 978-958-44-6894-9
Libro de Biometra Comunitaria
Fundacin Universitaria Juan N Corpas
Facultad de Medicina
Departamento de Medicina Comunitaria
Bogot - Colombia
2010
CONTENIDO
INTRODUCCIN AL TEXTO
Este texto es un intento de integrar la epidemiologa, la investigacin y la estadstica en un
compendio elemental y sencillo para todos los que trabajan en el rea de salud y se hacen
preguntas en torno a sus trabajos. Surge por la conviccin de que la realidad integra estas tres
reas del conocimiento y por ello pretende presentarlas de esa manera ante los ojos de los
lectores.
Est escrito de manera sencilla y ha usado un sistema de clasificacin en donde se parte de una
visin general (que introduce a los otros captulos) en el captulo uno, para adentrarse en la utilidad
prctica de la epidemiologa haciendo nfasis en la comprensin de la tabla de contingencia y el
mundo de las relaciones, pasando en el captulo tres a una visin de la investigacin como principal
herramienta de la epidemiologa. All se mencionan algunos aspectos claves de interpretacin en las
investigaciones. El ltimo captulo es dedicado a entender el lenguaje de la investigacin y, por
ende, de buena parte de la epidemiologa. Se hace un esfuerzo a travs de ejemplos con el fin de
mostrar el uso de los principales trminos estadsticos.
La razn de este libro es eminentemente pedaggica. A lo mejor, aquel que lo lea con deseos
encuentre en sus explicaciones una ganancia que le servir para hacer proyecciones en la poblacin
objeto de su trabajo. Ese es el anhelo: Que sirva!
Los autores.
Captulo 1
Introduccin a la
Epidemiologa
1.1. Palabras para una definicin .............................................................. 9
1.2. La utilidad de la epidemiologa ......................................................... 11
1.2.1. Buscando las causas ..................................................................................11
1.2.2. La ayuda para la salud pblica ...................................................................14
1.3. Las herramientas de la epidemiologa ............................................... 16
1.3.1. La observacin ...........................................................................................16
1.3.1.1. La descripcin .........................................................................................18
1.3.1.2. La comparacin .......................................................................................20
1.3.1.3. La intervencin .......................................................................................21
1.4. Las ayudas en la epidemiologa ....................................................... 22
1.4.1. El raciocinio cientfico .................................................................................22
1.4.2. El Papel de la estadstica ...........................................................................23
1.5. La estrategia de la epidemiologa ..................................................... 25
1.5.1. La investigacin .........................................................................................25
1.5.2. Las variables ..............................................................................................26
1.5.3. Los datos y las medidas .............................................................................29
1.5.4. La bsqueda de la validez para la salud .....................................................30
CAPTULO 1: INTRODUCCIN A LA
EPIDEMIOLOGA
Definiciones1:
Enfermedad: alteracin ms o menos grave de la salud.
Frecuencia: nmero de veces que se repite algo.
Etiologa: estudio de las causas de las cosas.
Salud: estado en el que el ser humano ejerce normalmente
todas sus funciones.
Mtodo cientfico2: mtodo de estudio sistemtico de la
naturaleza que incluye las tcnicas de observacin, reglas
para el razonamiento y la prediccin, ideas sobre la
experimentacin planificada y los modos de comunicar los
resultados experimentales y tericos.
Poblacin: Conjunto de personas que habitan la Tierra o
cualquier divisin geogrfica de ella.
1
Real Diccionario de la Lengua.
2
Enciclopedia Encarta 2005.
Un interesante ejemplo de la utilidad del pensamiento etiolgico, o lo que es
lo mismo, causal de la epidemiologa, es la investigacin de Semmenweis
(5) en torno a la fiebre puerperal en 1840 A travs de un juicioso anlisis
Semmenweis logr establecer lo que se poda hacer para combatir la fiebre
puerperal an antes de saber la existencia de los microbios responsables de las
infecciones. Estableci que un lavado adecuado de las manos antes de valorar a las
mujeres en trabajo de parto poda disminuir la incidencia (aparicin de casos nuevos)
de la temible enfermedad.
Si bien Semmenweis no descubri al estreptococo, responsable etiolgico de la fiebre
puerperal, s descubri que en la causa de la fiebre puerperal, el no lavado de las
manos es un factor esencial. Interviniendo sobre este componente causal, logr
modificar la distribucin de la enfermedad.
Johann Peter Frank en 1779: fue un extraordinario exponente del papel rector del
Estado en la salud de la colectividad. Su obra SISTEMA DE UNA POLICA MDICA
COMPLETA promova una intervencin (con sanciones) del Estado en la salud de los
sbditos del imperio Austro-Hngaro. Promova una polica sanitaria.
1.3.1. La observacin
La observacin tiene una connotacin especial en epidemiologa. Sin
duda, corresponde al primer paso del mtodo cientfico y concluye con
el planteamiento del problema, expresando de esta manera la
concrecin de la observacin. En general y, hasta hace muy poco, las
observaciones correspondan a manifestaciones que dieron pie a la
construccin de enfermedades. Hoy, adems, lo hace a los procesos que
preservan la salud. Lo cierto es que la epidemiologa ha provocado
extraordinarios planteamientos de problemas a travs de los cuales ha
logrado beneficiar a la humanidad cuando los contesta.
1.3.1.1. La descripcin
Una vez planteado el problema, la epidemiologa describe, y lo hace
para entender. Describir es mencionar lo que se ve usando referentes.
Para ello, primero ordena y luego clasifica. Un ejemplo de la
extraordinaria capacidad descriptiva que usa la epidemiologa son los
aportes que ha hecho a las enfermedades a travs de lo que se conoce
como la historia natural. Ah la epidemiologa, usando una serie de
criterios, describe a las enfermedades permitiendo entenderlas.
1.3.1.2. La comparacin
VARIABLE
DEPENDIENTE
SI NO
PRESENTE PRESENTE
Si presente a b a+b
VARIABLE
INDEPENDIENTE
No presente c d c+d
a+c b+d
La comparacin es una de las formas ms usadas para que -el ser humano
aprenda. Por ejemplo, al analizar (igual a comparar) las manifestaciones
presentes en una enfermedad, se hace indispensable comparar enfermos con
sanos y ver quines tienen o no la situacin o caracterstica a comparar.
Esta seleccin, de hacerse sistemticamente con todos los componentes, permitir
ver qu tienen y qu no tienen los enfermos, diferencia esencial para plantear
interpretaciones. Para poder confirmar si existen o no diferencias, se usa la
estadstica. De hecho un rea de la estadstica est destinada a analizar si las
diferencias halladas al comparar son producto del azar o si ciertamente son
diferencias que siempre estn. Lo cierto es que buena parte de este texto va estar
dedicado a ensear a usar e interpretar esta tabla (la de contingencia).
1.3.1.3. La intervencin
Datos
EDADES N %
De 10 A 12 aos 3965 32
De 13 A 16 aos 7200 59
De 17 A 19 aos 997 8
Variables GENERO N
6274
%
51
Mujeres
ESTRATO N %
Estrato 1 347 3
Estrato 2 Indicadores 8958 73
Estrato 3 2475 20
ESTRUCTURA FAMILIAR N %
Nuclear completa 6862 56
Nuclear incompleta 3774 31
Recompuestas 1112 9
Hogares donde faltan ambos padres 227 2
FUNCIONALIDAD FAMILIAR N %
Buena funcin familiar 7722 63
Disfuncin moderada 2731 22
Disfuncin severa 920 7
1.5.1. La investigacin
Por ejemplo, se quiere saber si un medicamento cura una enfermedad.
Una forma de saberlo sera ver qu enfermos han recibido el medicamento y
cuntos se han curado. Otra, sera dividir a los enfermos en dos grupos: a
unos darle el medicamento y a otros no y ver en cul de los dos grupos se
curan ms. Son dos diseos que pretenden averiguar lo mismo. Pero uno de ellos
resulta ms vlido, es decir, ms probable que de seguirlo, la respuesta sea ms
coincidente con la realidad cierto? Ms adelante se volver a tratar el asunto
(Captulo3, paso6). Vlido es entonces la aproximacin con la realidad ms valido
es ms cerca de la realidad.
Una variable sola rara vez permite describir a travs del dato lo que se
quiere ver. Habitualmente, es la suma de varias variables con sus
respectivos datos los que, unidos permiten ver lo que se busca. Por
ejemplo, si se quiere saber si un servicio mdico es bueno se debern
medir muchas variables, tales como grado de recuperacin de la salud de la
poblacin enferma, percepcin de la poblacin, costos en que se incurre, y claro, en
este caso, se debern construir sub variables de cada aspecto, que permitan
calificar a travs de los datos. Tal vez un ejemplo ms sencillo (pero dejando el
anterior para discusin) es cmo saber si un enfermo se est recuperando con unas
medidas teraputicas. Las variables que se debern medir son aquellas que la
enfermedad haba afectado. Por ejemplo: los signos vitales y las otras
manifestaciones. Sumando todos los datos que se obtienen de cada variable se podr
decir que s o no se recuper.
El ser humano crea clasificaciones para entender. El asunto grave se produce
cuando ante unos mismos eventos o criterios, se construyen distintas
clasificaciones. Ah ponerse de acuerdo es muy difcil. Desafortunadamente
esto ocurre con ms frecuencia de la que se debera. Las VARIABLES son
una buena muestra de mltiples clasificaciones. Por ejemplo, para el uso de la tabla
de contingencia que se revisar a lo largo del texto, la clasificacin como variable
DEPENDIENTE (que es la que siempre se tiene en cuenta) e INDEPENDIENTE
(que son las que se van cruzando con la dependiente) resulta clave. Pero al hacer
anlisis de investigaciones surge otra clasificacin muy interesante: variable
INTERVINIENTE, referida a aquellas caractersticas que intervienen de alguna
forma en algo que se est estudiando. Lo interesante de todo esto es que se debe
tener una mente amplia y dispuesta a no encasillarse. Por ejemplo, si se desea
estudiar factores que se relacionen con la aparicin de una enfermedad, esta ltima es
la variable dependiente y los factores que se estudien son la variable independiente.
Un ejemplo de variable interviniente puede ser la relacin entre cncer de pulmn y
caf en una investigacin: pero resulta que los que toman caf presentan una
condicin: es que fuman ms. Por ende, esa relacin entre caf y cncer es el
resultado de una variable interviniente de los que toman caf, y es que fuman. Ah!
pero en algunos textos mencionan que la variable interviniente es aquella que pone
el investigador en los diseos experimentales. Por ello, es tan importante definir
trminos antes de discutir.
Las variables que usan datos cuantitativos son ms tratables que aquellas
que usan datos cualitativos. Ms tratables se refiere a que la estadstica
descriptiva se acomoda mejor y, por ende, la obtencin de referentes que
permitan entenderla ms. As, por ejemplo, ante la variable talla de una persona, el
dato en metros o centmetros es ms fcil de entender (y por tanto de comparar) que
el dato de disfuncin severa o moderada en la aplicacin del test de APGAR FAMILIAR
(variable). Cuando se habla del tamao en centmetros todos lo entendemos. Cuando
se habla de disfuncin familiar cada uno puede imaginar algo un poco diferente
que vaina ser tan positivista, pero as son las cosas!
Captulo 2
La Utilidad de la
Epidemiologa
2.1. La lucha contra la enfermedad ...................................................................... 33
2.1.1. El arte de describir .........................................................................................33
2.1.1.1. La historia natural de las enfermedades..........................................................37
2.1.1.1.1. Ejemplo: Historia de una epidemia (SIDA) ...................................................45
2.1.1.2. La cadena epidemiolgica .............................................................................48
2.1.2. La tabla de frecuencias...................................................................................51
2.1.3. La forma de aprender: comparar .....................................................................53
2.1.4. La tabla de comparacin: los factores de riesgo y la evaluacin de lo que sirve .....54
2.1.4.1. Usos de la tabla de comparacin ....................................................................58
2.1.4.1.1. Identificacin de riesgos ...........................................................................59
2.1.4.1.1.1. Presentacin de una tabla de contingencia ................................................64
2.1.4.1.2.Otras comparaciones: sensibilidad y especificidad ..........................................65
2.2. Buscando las causas .................................................................................... 69
2.2.1 La maravilla de las relaciones y las asociaciones ..................................................70
2.2.2. La red causal .................................................................................................78
2.2.2.1. Las causas necesarias y suficientes ................................................................79
2.3. Buscando la salud pblica: La vigilancia epidemiolgica: .................................. 83
2.3.1. La importancia de los registros .........................................................................84
2.3.2. El arte de la prediccin ....................................................................................85
2.3.3. Aporte de la epidemiologa a la salud comunitaria ...............................................87
2.3.3.1. La estrategia de la identificacin ....................................................................90
2.3.3.2. Para decidir.................................................................................................91
2.3.3.3. Para organizar .............................................................................................91
2.4 Hacia dnde va la epidemiologa. Mirando la evidencia de la utilidad ................ 93
2.4.1. Una mencin de xitos y limitaciones ................................................................96
Usos de la epidemiologa ........................................................................................ 103
CAPTULO 2: LA UTILIDAD DE LA
EPIDEMIOLOGA
o por la causa (o lo que se crea antes y que hoy se sabe) que provoca
las manifestaciones (y, as mismo, la enfermedad), Por ejemplo,
enfermedades infecciosas o entidades tumorales. Sin duda un elemento
cardinal en la descripcin fue el ordenamiento. Ordenar es un
componente esencial de la descripcin. Se ordena siguiendo criterios,
que deben, en lo posible, ser simples y aplicables. Solo as se logran
conseguir que otros describan y al hacerlo la capacidad de entender a la
enfermedad se potencializa. La descripcin permite reconocer.
TIPO DE FAMILIA N %
Familia Nuclear
Completa 7 619 62
Incompleta 5 386 39
Extensa 2 854 21
Familia reconstituida
Con padrastro 1 065 8
Con madrastra 171 1
Bajo el mismo techo vive con
Hermanos 10 188 85
Abuelos 1 595 12
Tos y primos 786 6
Primos 207 2
Cuada 60 0.4
Ciclo Vital Familiar
Familia con hijo mayor adolescente 5 161 38
Funcin Familiar
Buena funcin 8 590 68
Disfuncin moderada 3 029 24
Disfuncin severa 998 8
Tabla de frecuencia que expresa cmo son las familias de 13 699
adolescentes de 12 colegios pblicos de la localidad de Suba en el ao
2007. Tiene tres columnas: la primera muestra los criterios de familia que
se estn presentando, la segunda el nmero y la tercera el porcentaje.
Estas son las tres columnas bsicas.
VARIABLE
DEPENDIENTE =
CANCER DE PULMON
SI NO
PRESENTE PRESENTE
Tabla de contingencia
SIGNOS DEFECTOS O
SINTOMAS DAOS
CAMBIOS TISULARES
FOMENTO
DX PRECOZ LIMITACION REHABILITACION
PROTECCION DAO
TTO INMEDIATO
PREPATOGENICO PATOGENICO
Un buen ejemplo del rompimiento de la trada ecolgica es el caso del SIDA. Surge
en un ambiente propicio por la pobreza (con todas sus consecuencias), a travs de
un organismo nuevo (dado que no se conoce, no existe respuesta inmune) y por
ende, muy agresivo (virulento) y afecta a personas en condiciones desventajosas.
canales
6000
5000
4000
Epidemia
3000 Serie1
2000
control
1000
0
1 2 3 4 5 6 7 8 9 10
Eduardo Jenner en 1780 describi magistralmente cmo los granjeros que curaban a los
caballos de un mal denominado Ajuagas y que despus ordeaban, trasmitan a las vacas,
y desde estas a las personas, lo que denominaban el cowpox o viruela de las vacas. Pero
lo realmente extraordinario de su descripcin fue hacer notar que aquellos a los que les
daba cowpox no les daba viruela. De ello dedujo que el contacto con la viruela de las vacas
protega contra la mortal viruela humana. Concluy que si inoculaba una pequea cantidad
en las personas podra evitar la viruela.
Dado que el estudio de las infecciones ha sido una de las reas donde la
epidemiologa ha demostrado su desarrollo, la identificacin de la ruta
que sigue un agente infeccioso permite disear conceptualmente una
cadena con los siguientes eslabones:
1. Fuente de infeccin
2. Puerta de salida
3. Va de diseminacin
4. Puerta de entrada
5. Susceptible
CADENA
DE INFECCION DIRECTO
MODOS DE
TRANSMISION
INDIRECTO
HUMANOS
AMBIENTE
RESERVORIO
INMUNIDAD
ANIMALES
SUCEPTIBILIDAD HUESPED
Sin embargo, se sabe que existen enfermedades de transmisin sexual que el hombre
traspasa a animales y stos pueden devolvrsela al hombre en aquellas situaciones en
donde se promueve el contacto sexual hombre-animal.
Porcentaje
CRITERIOS Frecuencia Porcentaje BARRAS
acumulado
CRITERIO 1 2 6,70% 6,70%
CRITERIO 2 2 6,70% 13,30%
CRITERIO 3 2 6,70% 20,00%
CRITERIO 4 2 6,70% 26,70%
CRITERIO 5 2 6,70% 33,30%
CRITERIO 6 4 13,30% 46,70%
CRITERIO 7 8 26,70% 73,30%
CRITERIO 8 2 6,70% 80,00%
CRITERIO 9 1 3,30% 83,30%
CRITERIO 10 1 3,30% 86,70%
CRITERIO 11 1 3,30% 90,00%
CRITERIO 12 1 3,30% 93,30%
CRITERIO 13 1 3,30% 96,70%
CRITERIO 14 1 3,30% 100,00%
Total 30 100,00% 100,00%
Una buena tabla de frecuencias debe hablar por s misma: ello quiere decir que cualquiera
que la vea sepa de qu se trata y qu describe. As mismo, es muy importante colocarle
un ttulo a la tabla. Debe tener: las caractersticas que describe, la poblacin que
describe, y cundo y dnde se realiz. La primera columna se denomina COLUMNA
MATRIZ y ah se ubica lo que se va a describir y la primera fila se denomina as mismo fila
matriz y describe las caractersticas que se van a exponer.
EDADES N %
De 10 A 12 aos 3965 32
De 13 A 16 aos 7200 59
De 17 A 19 aos 997 8
GENERO N %
Mujeres 6274 51
ESTRATO N %
Estrato 1 347 3
Estrato 2 8958 73
Estrato 3 2475 20
ESTRUCTURA FAMILIAR N %
Nuclear completa 6862 56
Nuclear incompleta 3774 31
Recompuestas 1112 9
Hogares donde faltan ambos padres 227 2
FUNCIONALIDAD FAMILIAR N %
Buena funcin familiar 7722 63
Disfuncin moderada 2731 22
Disfuncin severa 920 7
Por ejemplo, la tabla est numerada, dice que muestra (CARACTERISTICAS) de
quin, de dnde y cundo. Ah! es parecida a otra presentada antes (subttulo
2.1.1.), pero aquella tiene ms poblacin que esta.
VARIABLE
DEPENDIENTE
SI NO
PRESENTE PRESENTE
Si presente a b a+b
VARIABLE
INDEPENDIENTE
No presente c d c+d
a+c b+d
VARIABLE
DEPENDIENTE =
CANCER DE PULMON
SI NO
PRESENTE PRESENTE
a
a+b
c
c+d
Dado que lo que se compara son dos eventos distintos, en este caso dos
nmeros (obtenidos de manera diferente o lo que simblicamente es a/b)
entonces la medida con que se conoce esto es la de RAZON.
VARIABLE
DEPENDIENTE =
CANCER DE PULMON
SI PRESENTE
que en el captulo 4 se ampliar el concepto, sea este el momento de decir
que con el fin de hacer entender se usan nmeros. Por ejemplo, el nmero de
personas con cncer del pulmn. Sin embargo, a veces el nmero no permite
entender todo lo que se quiere, entonces la proporcin se convierte en una
importante alternativa. Ah se comparan el nmero de casos dividido por el total de
poblacin referenciada y se multiplica por 100. Por ejemplo, nmero de fumadores
dividido por el total de cnceres del pulmn multiplicado por 100. Se obtiene la
proporcin de cncer en los fumadores. Pero existe otra forma ms interesante de
comparacin: y son las razones: ac se compara un dato con otro dato diferente (a/b).
Por ejemplo, el resultado de fumadores con cncer dividido con el resultado de cnceres
en no fumadores. Todas estas expresiones numricas solo pretenden hacer entender y el
uso de una u otra manera dependen de la capacidad de cada una de contribuir con el
entendimiento.
Ampliando el concepto: Las razones son una manera de presentar
informacin, usando como referente el denominador de la divisin de dos
datos. Se compara el numerador (A) con el denominador (B) y se usa
siempre como 1 el denominador el que se compara con el resultado de la
divisin A/B. Por ejemplo, en un saln existen 30 personas y de ellas 10 son hombres y
20 mujeres. Ante la pregunta cul es la razn mujeres-hombres: A= 20 mujeres. B= 10
hombres. La razn mujeres/hombres ser: 20/10 = 2. Entonces se presenta as: Por
cada hombre (siempre el denominador es 1) existen 2 mujeres (el resultado de la
divisin). Si la pregunta fuera cul es la razn hombres-mujeres, entonces sera 10/20 =
0.5. Se expresara que por cada mujer existe 0.5 hombre.
aXd
bXc
El resultado en este estudio del OR fue de 14. Expresado a manera de
riesgo es as:
VARIABLE
DEPENDIENTE =
CANCER DE PULMON
SI PRESENTE
VARIABLE Si FUMA 14
INDEPENDIENTE
= FUMAR No FUMA 1
Resulta interesante analizar que los doctores Doll y Hill detectaron esta
poderosa relacin en 1950. Quiere decir que desde entonces existan
fuertes indicios de la relacin entre fumar y el cncer del pulmn. Ello no
evit que surgiera por parte de las tabacaleras una fuerte promocin al
consumo de cigarrillos, la que fue tan efectiva que hoy se considera que es
la principal adiccin del mundo. Y ello sabiendo que induce no slo al
cncer sino a otras muchas enfermedades. De ah el dicho: TENER LA RAZN NO ES
RAZON SUFICIENTE PARA SEGUIRLA.
VARIABLE DEPENDIENTE =
ENFERMEDAD
SI NO
tiene tiene
SI tiene la variable NO tiene la variable
Total SI expuesto
SI expuesto dependiente y SI esta dependiente y SI esta
VARIABLE
expuesto = a expuesto = b = a+b
INDEPENDIENTE
= FACTOR DE Si tiene la variable NO tiene la variable Total NO
EXPOSICION dependiente y NO dependiente y NO expuesto
NO expuesto
esta expuesto = c esta expuesto = d = c+d
Total SI tienen la Total NO tiene la
variable variable
dependiente = a+c dependiente = b+d
Hill:
VARIABLE DEPENDIENTE
SI NO
CANCER CANCER
VARIABLE
INDEPENDIENTE
PULMONAR PULMONAR
(EXPONERSE AL SI FUMO 647 622 1269
CIGARRILLO) NO FUMO 2 27 29
649 649
El producto de relacionar a los que se exponen y les dio el cncer es = 647/1269 con los
que no fuman y les dio cncer = 2/29 provoca una relacin:
RR
Si fumo y SI
7,4
cancer pulmonar
No fumo y SI
1
cancer pulmonar
Es decir que aquellos que fuman al ser comparados con los que no fuman, les da cncer
7,4 veces ms.
Lo cierto es que los resultados originales no fueron dados con RR sino con OR (que se
trata de otra medida de relacin) dando una relacin de riesgo an mayor. Ello por el tipo
de investigacin.
En ese mismo estudio, surgi la pregunta de si ser hombre (comparado obviamente con el
de ser mujer) era un factor de riesgo para la aparicin del cncer. La tabla se construy
as:
Si cncer No cncer RR
Hombre
647 600 1247 0,518845229 1,00
fumador
Mujer
41 38 79 0,518987342
fumadora
688 638
Fue necesario hacer una nueva clasificacin y separar a los hombres y las mujeres en
fumadores y no fumadores (esto se conoce como proceso de estratificacin y se
mencionar ms adelante). Lo que se busca es analizar si existe correspondencia entre el
gnero y el cncer; por ende, se busc que tanto los hombres como las mujeres que
estuviesen expuestos, se relacionaran con el cncer. Los resultados fueron los expuestos
en la tabla (aunque los datos expuestos no fueron los del estudio original, sirven de
ejemplo para el aspecto que se est revisando).
RR
Si hombre y SI
1,0
cancer pulmonar
No hombre (mujer)y
1
SI cancer pulmonar
Se interpreta que por cada mujer fumadora y con cncer, existe 1 hombre fumador con
cncer. Es decir que da lo mismo ser hombre fumador o mujer fumadora en torno al
cncer. Resultado por dems lgico.
Para poder expresar el ltimo ejemplo, se usa un estudio de las favelas del Brasil donde se
buscaban factores de riesgo y proteccin que fuesen tiles para disminuir la incidencia de
jvenes asesinados. El factor estudiado fue si haban asistido a la educacin primaria y se
encontr:
VARIABLE DEPENDIENTE
SI NO
asesinados asesinados
SI estudios
VARIABLE 46 168 214
primarios
INDEPENDIENTE
NO estudios
118 48 166
primarios
164 216
RR
Si estudios
primarios y SI 0,3
asesinado
No estudios
primarios y SI 1
asesinado
Se interpreta que por cada joven que No tuvo estudios y fue asesinado, hay 0,3 jvenes
que si estudiaron y fueron asesinados. Como es menos de 1, claramente expresa que
estudiar es un factor que protege a los jvenes de ser asesinados.
Pruebas de significancia
Que se compara
medida
ACTITUDES
Quiere tener un hijo este ao No cree que papas apoyaran planificacin
VARIABLE DEPENDIENTE
SI NO
ENFERMEDAD ENFERMEDAD
A manera de ejemplo, obsrvese el valor del signo de Blumberg en la tabla
resultante de un estudio de probabilidades diagnsticas de apendicitis
efectuado en una clnica de Bogot en el 2002.
VARIABLE DEPENDIENTE
SI NO
APENDICITIS APENDICITIS
SI BLUMBERG 128 86 214
NO BLUMBERG 34 249 283
162 335 497
Lo que expresa es que el signo de Blumberg estuvo presente en 128 pacientes de un total
de 162 con apendicitis (si se multiplica el resultado por 100 se obtiene la sensibilidad).
Que no estuvo presente en 249 de un total de 335 pacientes que no tenan apendicitis (si
se multiplica por 100 se obtiene la especificidad). Expresa:
El escorbuto era en los siglos XVII y XVIII el terror de los viajes largos en ultramar.
Muchos mdicos estaban dedicados a descifrar su origen. James Lind como mdico al
servicio de su majestad en la marina imperial, escribi un informe donde expona una
investigacin de cmo combatirlo. A las seis semanas de estar en alta mar se present un
brote de escorbuto en 12 marineros.
Hizo consideraciones acerca del clima, de la humedad, de los alimentos y del tiempo de
estar en alta mar (componentes sobre los que existan hiptesis que los responsabilizaban
como causa de esta temible enfermedad) llegando a la conclusin de que en la gnesis de
la enfermedad la ausencia de alimentos frescos aparece como una probable sospechosa.
As que dividi en seis parejas a los enfermos (20 de mayo de 1747), los puso en un
mismo sitio del buque (descartando as que el lugar pudiese ser un determinante) y a
todos les suministr una dieta bsica similar, agregndoles de manera diferencial
(interviniendo con dietas propuestas por otros mdicos que haban escrito al respecto): a
una pareja caldo de cordero fresco, a otra, un cuarto de galn de sidra, a la siguiente 25
gotas del elixir de vitriolo (bebedizo a base de sales de arsnico) tres veces al da, a otra
tres cucharadas de vinagre en ayunas; a la quinta pareja, con agua de mar y a la ltima
pareja, dos naranjas y dos limones diarios. En seis das observ una recuperacin franca
de la pareja que reciba naranjas y limones. Lind descubri cmo se trataba el escorbuto
muchos aos antes de saber cul era su causa. Claro luego el descubrimiento de Lind
permiti saber el papel de la vitamina C en la gnesis del escorbuto.
Las grandes tabacaleras han usado esa falta del 100% de la relacin
para poner dudas acerca de la efectividad de medidas como prohibir
fumar, usando su poder para evitar que polticas restrictivas progresen.
Es muy evidente la relacin que existe entre muerte y armas de fuego. Esta
relacin se ve en una tabla comparativa o de contingencia en una poblacin,
donde se buscara: variable dependiente S muerte y No muerte y como
variables independiente S uso de arma de fuego y No uso de arma de fuego. Por
supuesto que la medida de la relacin (OR) dara muy seguramente un valor muy alto. Si
gusta hgalo.
1.
Por ejemplo, en el caso de la tuberculosis:
Por ello se debe tener sumo cuidado con las personas que se creen
poseedoras de la verdad absoluta. La evidencia dice que suelen estar
equivocadas. La verdad cientfica es muy relativa y puede cambiar en la
misma forma que se hacen nuevos descubrimientos.
Robert Koch (1843-1910) propuso para poder confirmar que un germen es responsable de
una enfermedad que debera cumplir con estos cuatro principios:
Hoy se diagnostican las infecciones con la bsqueda del germen a travs de aislamiento
directo o por la deteccin de su presencia a travs de anticuerpos o antgenos, razn por
la cual la inoculacin en animales se ha disminuido.
2
3 1
a CAUSA = 1+2+3+a+I+II
I II
42
G 1 CAUSA= 1+2+4+G+H
n i
G CAUSA = 1+i+n+G+H
1
H
Tasas de
Exposicin al
Fumadores cncer
asbesto
pulmonar
NO NO 11
SI NO 58
NO SI 123
SI SI 602
Un buen ejemplo lo expresa la tabla obtenida de la investigacin de
Hammond y colaboradores en 1979 en la cual se refleja cmo la
interaccin entre exposicin de asbesto y fumar se relaciona con
unas tasas (por 100.000) casi tres veces mayores que las que se
obtendran de sumar cada una de las exposiciones (la suma de s
asbesto=58 + S fuma=123 es 181 cifra aproximadamente menor
en un tercio a los 602 obtenidos por la interaccin S asbesto y S
fumador).
Resulta obvio el valor de registrar informacin que nos sirva de indicadora. El asunto es
registrar. Para ello el encontrar el elemento que mejor nos indique es clave. Claro, dicho
elemento debe haber sido analizado para poder saber qu pensar en caso de que
aumente o disminuya su frecuencia. De ah surge el trmino de vigilancia, pues es
vigilando la frecuencia de tal elemento que se establecen los sistemas de alertas.
En la actualidad numerosas instancias se ocupan de hacer seguimiento a la
informacin. Los comits de vigilancia epidemiolgica en las IPS
(Instituciones Prestadoras de Servicios de Salud) se encargan de ofrecer la
informacin pertinente a los organismos sanitarios pertinentes. Por ejemplo,
toda IPS de segundo nivel en adelante ha de tener un comit de infecciones. Su tarea
es analizar las frecuencias de infecciones presentes en el hospital. Pero no los que le
llegan a travs de los pacientes. Analizan las que surgen dentro del hospital. Por qu
es importante? Sin duda por las repercusiones en los pacientes (en caso de que se
contaminen, se desencadenan infecciones muy agresivas), pero adems, porque a
travs del trabajo de dicho comit se puede analizar el control establecido dentro del
hospital, siendo un INDICADOR de calidad en la atencin. La calidad es en este caso el
resultado de las acciones que protegen de infecciones nosocomiales a la poblacin que
hace uso de dicho hospital.
La informacin es clave en la toma de decisiones. Existen algunas
enfermedades que sirven para mostrar distintos aspectos de la comunidad (y
sirven porque se emplean para comparar). Son entidades INDICADORAS o
TRAZADORAS. A travs de ellas se puede comparar. Por ejemplo, la mortalidad se
puede comparar por aos o luego de implementar polticas. Claro, los cambios de
mortalidad se toman tiempo. Los ingresos de urgencias o los ingresos hospitalarios
son fuentes de registros a travs de los cuales se puede obtener mucha informacin
para hacer anlisis. La forma como se presente la informacin es tambin clave. El
ejemplo del dibujo no es claro sin embargo, pretende mostrar unas grficas donde
se informa sobre el estado de unas condiciones de salud (en este caso
enfermedades)
En una muy hermosa discusin en el texto El desafi de la epidemiologa el
Doctor Milton Terris expone que la orientacin de los servicios de salud ha de
estar en manos de la epidemiologa. Esta disciplina a travs de sus mtodos y
sus medidas tiene la capacidad de poder evaluar los resultados de las
decisiones tomadas en torno a la salud y la enfermedad. Plantea que la medicina est
basada en la terapia y que la administracin solo mira recursos y solo la epidemiologa
trata de entenderlo todo. Por ejemplo, si se quiere medir la calidad de los servicios de
salud, las actividades indicadoras han de ser la morbimortalidad. Los administradores
pueden escoger percepcin del paciente y los financieros costos del sistema,
componentes que sin duda ven, pero, solo la morbimortalidad puede ofrecer una medida
integral. Y dicha medida es trabajada por la epidemiologa.
Por otro lado, no existe duda que las investigaciones administrativas son un buen reflejo
de cmo el mtodo epidemiolgico puede aportar. Las investigaciones de procesos o los
estudios de costos son un buen ejemplo.
La influencia de las condiciones sociales es ms que evidente en la salud del ser humano.
Desde el siglo XVII numerosos autores sealan la clara relacin entre condiciones de
miseria y enfermedades. Con ellos la visin de la salud pblica hace su aparicin. Cmo
combatir dichas condiciones? Dichas condiciones se desarrollan de acuerdo a los modelos
polticos que dan pie a los modelos econmicos. Unos modelos sostienen que el bienestar
se alcanza a travs del desarrollo econmico privado, otros que se logra a travs de una
fuerte presencia Estatal. Lo indudable es que la salud de la comunidad se ve influenciada
poderosamente a travs de cualquiera de estas posturas, pues de acuerdo al dominio de
una u otra postura se desarrollan los modelos sanitarios de cada pas.
CON
SIDA
Es como si el lema fuera: si lo paga, lo tiene absurdo postulado ya que la
poblacin que padece la enfermedad es en general pobre. Pero si no se
controla la enfermedad en dicha poblacin, la propagacin persistir. Ser
que si los que tienen les financian el tratamiento a los que no tienen, el
problema disminuye? La respuesta hipottica es que s. Pero, es ms, al hacerlo la
humanidad gana. Un ejemplo, que permite plantearlo es el caso de la viruela.
Cunto en la gnesis del cncer tendr que ver con el contacto de tanto producto
qumico al que la humanidad se expone? Los colorantes usados para volver ms
apetecibles los alimentos, los fertilizantes, los residuos, son apenas algunos de los
elementos en torno a los cuales se orientan la investigacin epidemiolgica en su
bsqueda de la causalidad.
1. Describir lo que ve
2. Compararlo y analizarlo
3. Tomar acciones (intervenir) en pro del beneficio del ser humano y
del mundo que lo rodea.
Usos de la epidemiologa
BUSQUEDA DE RELACIONES
CAUSALES
ESTUDIO
DE LA ETIOLOGIA
HISTORIA NATURAL DE
LAS ENFERMEDADES
ANALISIS DE
POBLACION
APLICACIN PARA
USOS DE LA
LA SALUD
EPIDEMIOLOGA PUBLICA
SERVICIOS DE
SALUD
TERAPEUTICAS
ANALISIS DE LAS
INTERVENCIONES
PREVENTIVAS
Captulo 3
Las ayudas en la
Epidemiologa: La
Investigacin
3.1. El raciocinio cientfico. La base ............................................................. 107
3.2. Los paradigmas de la investigacin....................................................... 111
3.2.1. Concepto de sesgos ................................................................................. 114
3.3. Las fases de la investigacin ................................................................ 118
FASE UNO: PLANTEAMIENTO DEL PROBLEMA .................................................... 121
1.1.Paso 1: Seleccin del tema ..................................................................... 121
1.2. Paso 2: Revisin bibliogrfica ................................................................. 122
1.2.1. Cmo se revisa un artculo ...................................................................... 124
1.3.Paso 3: Especificacin del problema o de la pregunta de investigacin ......... 128
1.4.Paso 4: Identificar las probables respuestas (las hiptesis) ......................... 130
1.4.1. Algo ms sobre las hiptesis de investigacin ......................................... 134
1.4.2. Las hiptesis estadsticas......................................................................... 137
1.5. Paso 5: Pertinencia de contestar la pregunta de investigacin (o importancia
de la respuesta de la pregunta) ............................................................... 139
1.6. Paso 6. Construccin de un marco terico ............................................... 141
1.6.1. Definicin de los componentes del problema: ......................................... 142
La historia del SIDA es un buen ejemplo: ante la muerte de una persona
joven por una enfermedad rara, un doctor se inquiet y empez a buscar
casos similares en otras partes; al hacerlo, identific una nueva
enfermedad. Con base a tal identificacin, empezaron a describirla siguiendo
criterios descriptores (historia natural, por ejemplo) y se dieron cuenta que era una
entidad verdaderamente grave (mortal). Entonces empezaron a buscar relaciones
(comparar). En primera instancia, los homosexuales se convirtieron en la poblacin
objeto de la mayora de los estudios, sencillamente porque eran las personas a las que
ms les daba. A travs de estudios de casos y controles (buscando relaciones)
detectaron que se comportaba igual que una ETS. Ello les permiti dar explicaciones
hipotticas, con lo que todos los estudios se dirigieron hacia las infecciones, lo que
determin el descubrimiento del virus. Identificadas las caractersticas del virus el
siguiente paso fue buscar cmo combatirlo, desarrollando los antirretrovirales. Ya con
ellos, lo siguiente es hacer pruebas de medicamentos que buscan evitar la muerte de
los enfermos. Al drselo a un enfermo predecimos que no morir (mortalidad) e
incluso, que mejorar (morbilidad)
Por ejemplo, en las encuestas de sexualidad practicadas sobre poblacin
adolescente se deben proponer diversos mecanismos para evitar que
respondan mentiras (sesgo de informacin). Que los profesores no estn
presentes o que las encuestas sean annimas, son algunos. Un caso de sesgo
de seleccin es si se va a probar un medicamento y se les da a pacientes menos
enfermos en tanto que a los ms enfermos se les da el placebo. Resultar muy posible
que existan ms mejoras en los que reciben el medicamento, cierto?... pero, ese
resultado est sesgado, no pudindose afirmar si la mejora es porque estaban menos
enfermos o atriburselo al medicamento. Y finalmente, y como muestra de un sesgo de
confusin (que es un resultado), se menciona la fuerte relacin entre cncer del
pulmn y tener los dedos amarillos. La relacin es de confusin pues es por fumar que
los dedos se ponen amarillos (impregnacin nicotnica) y, por consiguiente, la relacin
es entre el cigarrillo y el cncer y no entre los dedos amarillos y el cncer.
MEDIDA MEDIDAS
DE LA REALIDAD USADAS
Si se supone que la realidad es dar en el centro, la validez de algo est dada por la
cercana que se est del centro. Entre ms distante, ms error o sesgo. Y si lo que mido
siempre me da en un mismo punto lejos del centro entonces estoy ante un error
sistemtico.
Si lo que quiero medir es el tamao de una persona puedo usar como medida cmo le
parece a otros: ms alto, igual o menos. Esta medida depende de quien la responda (no
es confiable). En cambio si usa la altura en centmetros el dato es confiable, ya que
siempre que lo vuelva a medir, me dar el mismo dato en centmetros y real (vlido) ya
que eso es lo que mide, por consiguiente, se est usando una medida exacta. Obviamente
saber cul es mejor para una investigacin se cae de su peso cierto?
PANORAMA GENERAL
DEL PROCESOS
DE INVESTIGACION TERMINOLOGIA PASO 1:
PASO 2
SELECCINDEL TEMA
REVISION DE LA
BIBLIOGRAFIA SOBRE
PRINCIPALES ETAPAS FASE 1: EL TEMA
PLANTEAMIENTO
DE UN ESTUDIO DEL PROBLEMA
PASO 3
ESPECIFICACIN DEL
CUANTITATIVO PROBLEMA
ACTIVIDADES DE UN
ESTUDIO CUALITATIVO
PASO 4
IDENTIFICACIN DE PROBABLES
RESPUESTAS
(FORMULACION DE LA
FASE 5 PASO6 HIPOTESIS.)
DIVULGACIN CONSTRUCCIN DE
DE INVESTIGACIN UN MARCO TERICO
PASO 5
PERTINENCIA DE RESPONDER
LA PREGUNTA
PASO 7
FASE 2 SELECCIN DE
PASO 17 DISEO Y UN DISEO
PUBLICACIN PLANEACION
PASO 8
TESIS SELECCIN
DE LA POBLACION
ARTICULO
PASO 9
PASO 18 FASE 3 SELECCIN DE
PRESENTACIN TRABAJO VARIABLES (INSTRUMENTOS)
FASE 4 DE CAMPO
ANALISIS
DE DATOS PASO 10
ORAL MANEJO ESTADISTICO
CARTEL DE VARIABLES
PASO 14
RECOLECCIN DE
PASO 15 INFORMACIN PASO 11
REGISTRO DE CONSTRUCCIN
INFORMACIN DEL FORMULARIO
PASO 13
PASO 16
ELABORACIN DEL
PROCESAMIENTO
PROTOCOLO
DE INFORMACIN
PASO 12
PLAN DE
TRABAJO
Existen muchas formas de presentar el orden en que se debe hacer una investigacin. La
grfica expone uno. El orden que se presente (este u otro) debe cumplir con el requisito
de ser coherente, sistemtico y racional. Al fin de cuentas de lo que se trata es de aplicar
el mtodo cientfico como modelo para resolver una pregunta.
Hoy existen cursos de bsqueda de informacin en muchas partes. Sin duda vale
la pena hacer alguno y aprender a buscar pues ello determinar en su momento
la solidez de la investigacin que se obtiene al confrontar lo indagado con lo
revisado.
El concepto de biblioteca como tal se ha modificado. De ser un espacio real hoy ha pasado
a incluir los espacios virtuales en el mundo de las redes de informtica.
RESUMEN
Objetivo Estimar la relacin entre conocimientos, actitudes y prcticas
(comportamientos) de riesgo en la sexualidad juvenil y la estructura y
percepcin de funcionalidad familiar.
Metodologa Se realiz un estudio observacional de corte trasversal
entre 13 699 adolescentes (10 a 19 aos de edad) de 12 colegios pblicos
de la localidad de Suba. Se aplic una encuesta autodiligenciada donde se
interrog por conocimientos, actitudes y comportamientos sexuales y la
estructura y percepcin del funcionamiento familiar.
Resultados Edad media de los adolescentes 13,5 aos. Prevalencia de
relaciones sexuales de 17 %. El 8 % de los hogares presentan disfuncin
severa y 39 % son nucleares incompletos. Las mujeres tienen menos
relaciones sexuales que los hombres (OR 0.53; IC 95 %; 0.47-0.59). Se
presenta ms relaciones sexuales cuando los adolescentes perciben de
manera disfuncional a su familia (OR 2.06; IC 95 %; 1.72-2.48).
Conclusiones Es ms importante la percepcin de funcin familiar que la
estructura como factor de riesgo en la sexualidad de los jvenes.
Palabras Clave: Adolescentes, sexualidad, conocimientos, actitudes y
prcticas, relaciones familiares, colegios.
Los resmenes resultan muy importantes cuando se hace la revisin
bibliogrfica pues es lo que el investigador lee (porque se publica en todas las
bases de datos) para saber si el artculo es o no de su inters. Si lo encuentra
de su inters ser su misin leer el original siendo para ello necesario que sepa cmo
buscarlo. En el ejemplo, un resumen acerca de sexualidad, adolescencia, relaciones
familiares
Primer Apellido y luego las iniciales del nombre del autor. Ttulo de la
investigacin. Revista (con iniciales de identificacin internacional, si las
tiene). Ao, volumen, y pginas. Observe los ejemplos:
Esto es lo que
quiero construir
Esto es lo que
construyo
La seleccin de las variables a travs de las cuales se puede responder la
pregunta de investigacin no siempre se cumple como debera: por ello lo ms
til suele ser el emplear variables ya usadas en otras investigaciones y, por
ende, debidamente validadas. La grfica expresa una situacin por dems
frecuente como es, querer mirar algo (contestar una pregunta de investigacin), escoger
unas variables inadecuadas para ello y al final obtener una respuesta NO VLIDA, de
seguro porque las variables seleccionadas no fueron las adecuadas. Un ejemplo puede
ser que se est estudiando si existe relacin entre ser adicto al alcohol y la violencia en
jvenes. El error ser usar variables donde se pregunta por consumo de alcohol en los
jvenes, PERO no se puede precisar si se es o no adicto. Entonces encontrar que existe
relacin con comportamientos violentos no permite precisar que es por ser adicto. La
solucin ser usar variables que identifican no solo el consumo sino por sobre todo, la
adiccin al alcohol.
CARACTERSTICA N %
Sociodemogrficas
Edad
De 10 a 12 aos 4 481 33
De 13 a 16 aos 8 029 59
De 17 a 19 aos 1 009 8
Estratos
Estratos 1 y 2 10 460 79
Estratos 3 2 654 20
Estratos 4 o ms 76 1
VARIABLE N %
Conocimientos y actitudes
Ha recibido informacin sobre cmo planificar:
S y la entendi 4 768 36
S, pero tiene dudas 3 295 25
No ha recibido 5 051 38
Quin le ense sobre planificacin
Colegio 5 236 38
Padres 4 179 31
Por su cuenta 969 7
Servicio de salud 849 6
Amigos 793 6
SI NO IC 95% Valor
VARIABLE OR
N % N % LI LS P
Conocimientos y actitudes
Ha recibido
informacin sobre
cmo planificar
Femenino 2 437 52 2 284 48
Masculino 1,4 1,2 1,6 0,000
2 317 46 2 726 54
Casos incluidos:
7 630
Cree que el
condn protege
contra el Sida
Femenino 1 505 37 2 509 63
Masculino 0,4 0,3 0,4 0,000
2 383 57 1 829 43
Casos incluidos:
6 409
La tabla descrita muestra el diseo de una tabla comparativa. Ella debe mostrar
las variables que se quieren comparar (por ejemplo, ha recibido informacin
sobre planificacin), entre quienes se quiere comparar (femenino y masculino),
los datos que se comparan (s y no en nmero y porcentaje), la medida de la
comparacin (OR) y la estadstica usada en esta comparacin (IC95% con sus
lmites inferior y superior, as como el resultado de la prueba p del Chi cuadrado).
Lo cierto es que los resultados (respuesta a la pregunta de investigacin) de
cualquier investigacin cuantitativa sern en general presentados a travs de
tablas.
Por ejemplo, cuando se encuentra que la edad prevalente de inicio de
relaciones sexuales en una poblacin adolescentes escolarizados de estrato 1
y 2 es de 13,5 aos, al comparar en las revisiones bibliogrficas con
poblaciones similares la misma pregunta se podr afirmar o que lo hallado es
igual o es distinto, formando parte de la discusin la probable explicacin de la
similitud o la diferencia.
x y
Por ejemplo, si se quiere probar (hiptesis) que los ancianos se caen ms que los jvenes,
la variable independiente (x) ser la edad de los pacientes y la variable dependiente ser
las cadas. El rea sombreada en la figura, establece que s existe relacin (entre ms rea
de convergencia, ms relacin).
IAM
Fumar
CA
Las hiptesis complejas plantean relaciones entre ms de dos variables. Por ejemplo, el
tabaquismo (variable dependiente) se relaciona con el cncer y con el infarto (variables
independientes ambas). La complejidad la provoca la relacin entre ms de dos variables,
y, sin duda, nos acerca ms al mundo real donde los eventos se encuentran relacionados
con muchas variables.
A =B NULA
A =B ALTERNA
Es muy importante, cuando se piensa en la investigacin, que se tenga en claro
la forma como se beneficiar la poblacin objeto. Es el caso de investigaciones
en grupos poblacionales, tales como colegios, donde la poblacin adolescente
escolarizada es la que ser estudiada. Los investigadores deben pensar en cmo
podrn beneficiar a la poblacin que participa. Por ejemplo, en las encuestas de
deteccin de prevalencias de riesgos, ofrecer consulta para orientar aquellos
participantes que as lo deseen, puede ser una forma. Por supuesto que la presentacin
de los resultados en los colegios con sus comunidades (estudiantes, profesores o
padres) se da por descontado.
No Vale la
pena inventar
lo que ya esta
inventado!
1. Qu diseo va emplear
2. Cules variables va a emplear
3. Cul ser el manejo estadstico de cada variable
LA SOLIDEZ DE UNA
INVESTIGACION
DEPENDE DE LA
CAPACIDAD
DE
REVISION DEL
INVESTIGADOR
La bsqueda de los estudios o de las publicaciones es, hoy por hoy, un proceso al alcance
de todos. Las bases de datos electrnicas son sitios en donde se pueden encontrar una
inmensa cantidad de artculos, clasificados de distintas y ordenadas formas. Una base de
datos puede agrupar una inmensidad de revistas. Las bibliotecas donde estn
habitualmente tienen acceso a la totalidad del artculo; sin embargo, existen muchas en
donde solo se presenta el resumen del artculo y la revista donde est, debindose pagar
para poder acceder al estudio completo. La base de datos de la National Library of
Medicine probablemente sea la ms completa. Por ello, el aprender a buscar informacin
en ella es una herramienta muy til en las revisiones. El acceso a los resmenes
(summary) es gratuito.
Una de las diferencias que existan entre los investigadores de pases desarrollados y
no desarrollados eran las bibliotecas. Los primeros tenan enormes ventajas en torno al
acceso a la informacin. Hoy, gracias a las bases de datos y a las conexiones de
Internet, el acceso a la informacin es ms equitativo.
6. Cuestionario: Se debe dejar una parte del marco terico para describir las
variables que se emplearn, debidamente referenciadas.
Casi es hacer un libro acerca de la pregunta, de hecho muchos libros surgen de las
investigaciones y, el marco terico es el responsable del mayor desarrollo. Mucho del
marco terico surge de la revisin de artculos, por tanto, aprender a hacerlo resulta
particularmente importante.
Por ejemplo, en la bsqueda del origen del SIDA, surgi de las descripciones
A pesar de que se pueda creer que las personas piensan de manera diferente, la
realidad grupal (grupal = personas que viven con caractersticas similares) es que
la mayora piensa de una misma forma. Esto es por dems fcil de entender,
pues una persona en general se desarrolla con otras que lo afectan
poderosamente, influencia que se traduce en similitudes en la forma de ver las
cosas. Claro en el dibujo se expresa ante un mismo objeto dos maneras de
pensar distintas, pero es que se trata de dos personas que pertenecen a grupos
diferentes. Y cmo es de difcil que se pongan de acuerdo dos personas que
piensan distinto!
El marco terico no suele aparecer en los artculos publicados, pues stos buscan ser lo
ms concretos posibles; dicha indagacin se deja a las publicaciones tipo tesis o textos.
Planear lo
que se
quiere hacer
Es la clave!
Por ejemplo, si se quiere saber si el cigarrillo provoca cncer se ha de escoger
un diseo diferente al de indagar si existe relacin entre el cncer y el
cigarrillo, ya que el solo hallazgo de la relacin no precisa qu fue primero.
Ahora bien, si se toman personas que no tienen cncer y se observa a travs
del tiempo quines empiezan a fumar y luego comparar entre los que fuman y los que
no, en qu grupo se presentan ms casos de cncer, se podr precisar que fue el
cigarrillo el responsable de la aparicin del cncer (y no el cncer el responsable de
que se fume). Claro este ltimo diseo tiene problemas de logstica importantes,
pues se debe observar por mucho tiempo (de hecho los aos suficientes para que
aparezca el cncer), debe pensar en cmo mantener la poblacin, cmo medirla
(seguimiento) siendo apenas algunos de los problemas a enfrentar. En el primer
ejemplo, hacer una encuesta en la poblacin escogida es, sin duda, ms sencillo
cierto? Estos diseos tendrn mucho que ver con la validez, siendo los ms vlidos los
que se asemejan ms a la realidad. Las cohortes se acercan ms a la realidad que los
estudios de corte o de casos y controles cierto? Pero resultan ms difciles de
elaborar (ms adelante se aclara ms).
A: EXPERIMENTAL
B. OBSERVACIONAL
ENSAYO CLINICO
ENFERMOS ALEATORIO MEDIDA
DE MORBIMORTALIDAD
TTO
=
PLACEBO
=
Sucede que cuando una persona recibe algo en lo que tiene esperanzas, puede
momentneamente mejorar. Si lo que recibe es el placebo y se recupera transitoriamente
se est ante un efecto placebo, el cual ulteriormente desaparece. Esto se vio cuando
aparecieron los antirretrovirales en pacientes con SIDA que no saban que estaban
recibiendo el placebo y crean estar recibiendo la droga milagrosa. Momentneamente se
mejoraron, as despus, la mortalidad fuese la esperada.
Con el fin de evitar el sesgo del efecto placebo en los ensayos clnicos se
propone que la poblacin del experimento no sepa cul es control y cul
ser intervenida.
Lo anterior es lo que se conoce como estudio CIEGO. Si el que reparte
la medicacin (placebo e intervencin) tampoco sabe cul es cual,
entonces se denomina DOBLE CIEGO. Y si el que analiza los resultados
no sabe cul es cual y solo compara a dos poblaciones sin saber cul es
la intervenida, se denomina TRIPLE CIEGO. Claro los estudios con
menos sesgos son los triples ciegos. En ingls estos estudios se
denominan Randomized double blind trial.
2.1.1.3. El ensayo de campo es casi igual al ensayo clnico pero se
diferencia en que no interviene a poblacin enferma sino sana.
Pero el resto de caractersticas se debe cumplir. Por lo cual,
son los diseos para medir la efectividad de las vacunas, por
ejemplo, pues se parte de poblacin sana. Una muestra fue la
vacuna SALK contra la poliomielitis, donde participaron cerca
de un milln de nios.
2.1.2. Observacionales
Las series de caso permiten aprender muchsimo. Probablemente sean en
medicina la mejor actividad descriptora. Los hospitales deberan tener abiertos
sus archivos para poder describir las manifestaciones, tratamientos y dems de
los pacientes que all acuden. As, de seguro surgiran interesantes
planteamientos para hacer nuevas investigaciones en beneficio de los pacientes. En las
investigaciones, la tabla de frecuencia es la encargada de presentar las descripciones.
Por ello, saber construir una tabla descriptiva es un deber de los que anhelen ser
investigadores.
En una serie de casos se pueden hacer numerosas comparaciones a travs de las cuales
se puede aprender. Por ejemplo, en una clnica, el tomar todos los casos de dolor
abdominal de un ao ya pasado (retrospectivo) y observar en qu casos se diagnostic
apendicitis, permite al compararlo con los que no, identificar la sensibilidad y la
especificidad de las manifestaciones clnicas de la apendicitis. Es obvio que tal
investigacin puede contribuir a mejorar los procesos diagnsticos
Un ejemplo fue el estudio de Doll y Hill acerca del cncer del pulmn (casos) y
del cigarrillo (exposicin). Partiendo de pacientes con cncer del pulmn se
busc poblacin similar pero sin cncer y se observ (a travs de relaciones OR)
si fumaban o no. Se encontr una relacin expresada en OR de 16 (por cada persona
con cncer y que no fuma se encontr 16 con cncer y que fuman).
SI =
E
X
P
O COMPARA LAS
S COHORTES
SANOS I A LO LARGO DEL TIEMPO
C
I
O
N
NO =
Los estudios de cohortes se proyectan para hacerse mnimo durante el tiempo que se
toma una enfermedad en aparecer. Por ejemplo, en los estudios de cncer, la duracin
mnima ser 10 aos, pudiendo ser proyectados a ms de 20 aos. En la actualidad
existen muchos estudios de cohorte indagando sobre las distintas exposiciones del hombre
actual. Exposiciones a radiacin de los celulares, dao de audicin por el uso de audfonos
(para msica), exposiciones a qumicos en alimentos etc. Claro, en el momento en que en
las medidas se encuentren anormalidades estadsticamente significativas, tales estudios se
publican para impedir que se contine con las exposiciones dainas.
COMPORTAMIENTOS HABER SIDO GOLPEADO EN EL LTIMO AO HABER GOLPEADO A LGUIEN EN EL LTIMO AO LLEVAR UN ARMA
IC 95% IC 95% IC 95%
SI NO OR SI NO OR SI NO OR
LI LS LI LS LI LS
13 a 16 aos 2 432 (35) 4 459 (65) 2 512 (37) 4 346 (63) 746 (11) 6 122 (89)
1,41 1,28 1,56 1,59 1,44 1,77 2,27 1,88 2,75
10 a 12 aos 923 (26) 2 639 (74) 907 (26) 2 633 (74) 165 (5) 3 423 (95)
17 a 19 aos 356 (37) 615 (63) 137 (14) 836 (86)
1,36 1,14 1,61 2,54 1,94 3,32
10 a 12 aos 907 (26) 2 633 (74) 165 (5) 3 423 (95)
Masculino 2 062 (37) 3 574 (63) 2 405 (43) 3 194 (57) 752 (13) 4 864 (87)
1,65 1,51 1,8 2,66 2,44 2,92 3,06 2,63 3,57
Femenino 1 639 (28) 4 224 (72) 1 399(24) 4 447 (76) 305 (5) 5 584 (93)
Triste 446 (50) 446 (50) 414 (47) 473 (53) 141 (16) 744 (84)
2,15 1,81 2,55 1,93 1,62 2,3 1,96 1,51 2,53
Feliz 938 (25) 2 752 (75) 1 030 (28) 2 635 (72) 273 (7) 3 425 (93)
Disfuncin Moderada 1 064 (41) 1 538 (59) 1 102 (42) 1 510 (58) 299 (11) 2 311 (89)
2,02 1,82 2,23 1,75 1,58 1,94 1,51 1,28 1,77
Funcional 1 836 (25) 5 418 (75) 2 010 (28) 5 209 (72) 524 (7) 6 737 (93)
Disfuncin Severa 520 (59) 362 (41) 474 (54) 404 (46) 152 (17) 732 (83)
4 ,06 3,46 4,75 3,09 2,64 3,63 2,37 1,9 2,96
Funcional 1 836 (25) 5 418 (75) 2 010 (28) 5 209 (72) 524 (7) 6 737 (93)
Por ejemplo, en una investigacin que busc relaciones de edad, gnero, nimo y estructura y
funcin familiar con comportamientos violentos por parte de adolescentes escolares, se present
esta tabla de resultados: en la primera columna estn las variables dependientes (edad, gnero,
nimo y estructura familiar con funcionalidad familiar y las variables independientes son los
comportamientos violentos (haber sido golpeado en ultimo ao, haber golpeado a alguien en
ltimo ao y llevar un arma). Observe la tabla y se dar cuenta que los datos descritos permiten
que el que la lea sepa de dnde viene cada resultado (y si quiere lo obtenga). Mrela con
cuidado la sabe interpretar? Como ejemplo observe la relacin ms fuerte que es el OR de
4.06 que se encuentra al comparar la percepcin funcional con la disfuncin severa en la variable
haber sido golpeado el ltimo ao. Se expresa as: Por cada adolescente que S fue golpeado el
ltimo ao y percibe funcionalmente a su familia, existen 4.06 adolescentes que S fueron
golpeados y perciben disfuncionalmente a su familia. Esta relacin es significativa ya que los
intervalos de confianza del 95% as lo demuestran.
FUNDACION COCHRANE
Existe en el mundo una tendencia a hacer de los investigadores y de sus investigaciones
una gran comunidad cientfica libre de los conflictos de inters, donde todos podamos
participar y unir nuestros esfuerzos, buscando que lo que se indague pueda unirse y, as,
aproximarse ms a la realidad. Por ejemplo, si se trata de estudiar la eficacia de un
medicamento, la Fundacin Cochrane propone que, sin importar el sitio del mundo, los
investigadores se vinculen a los grupos de estudio y trabajen como si fuera una sola
investigacin. Para ello, todos los interesados en el estudio de tal medicamento deben
cumplir con un protocolo (que busca disminuir al mximo los sesgos) y una vez efectuada
la investigacin, compartir los resultados con los dems miembros de esa comunidad
cientfica. As se podrn unir bases de datos y hacer meta anlisis.
Como tales, son muy integrales, queriendo decir con ello que se acercan
mucho a la realidad: de hecho, y por ejemplo, en una investigacin para
implementar la habilitacin de una IPS, si no se observa todo, la realidad es
que la cierran!
Su mejor ejemplo son los estudios de costos por actividad en donde, y a
travs de ello, se pueden comparar la eficiencia de las EPS, de las IPS, de las
actividades de las empresas etc.
Los diseos cualitativos sostienen que la realidad no puede encajarse en los modelos
cuantitativos. Refieren que es cambiante y no rgida, por lo que sus diseos procuran ser
tan flexibles como la realidad se puede presentar.
MUESTRA
POBLACION
ENFERMOS
SANOS
Una poblacin es el agregado total de casos que cumplen con una serie determinada de
criterios. Poblacin accesible son los casos de poblacin que cumplen con criterios y que
son accesibles al investigador. Poblacin blanco es la poblacin sobre la que se quiere
hacer inferencias.
ENFERMOS
TTO
=
COMPARAR A TRAVES
DEL TIEMPO
PLACEBO
=
El dibujo expresa uno de los tipos de sesgo de seleccin: imagnese que se tiene una
poblacin de enfermos de SIDA y como resulta obvio, en esa poblacin existen unos ms
enfermos (en el dibujo, los que estn encerrados por un cuadrado) que los otros (por
ejemplo, tienen notoriamente ms disminuida la poblacin de linfocitos T, as como ms
bajo el peso promedio). Entonces, se desea probar la eficacia de un nuevo medicamento
(llamado TTO). Resulta lgico que para probar la utilidad se debe dividir a los enfermos en
dos grupos y a uno suministrar TTO y al otro no (solo as se puede identificar si sirve o
no). Pero se escoge a los menos enfermos en el grupo del TTO (a los que se les dar el
medicamento) y a los ms enfermos en el grupo que se le dar el placebo. Al cabo del
tiempo se mide quines se curaron ms: si los del grupo TTO o los del grupo Placebo. En
este ejemplo, result que fueron los del grupo TTO (3 de 4 se mejoraron). Ahora la
pregunta es: se puede estar seguro de que este resultado es vlido? Ello significara que
se podra asegurar que los que reciban TTO se curarn ms que los que reciban placebo.
Si bien el resultado pone en evidencia que en TTO se curaron 3 y en placebo solo 1, no se
puede estar seguro de que este resultado se debi al TTO. Por qu? Pues porque los que
recibieron TTO estaban menos enfermos que los otros (por ende, NO SON
COMPARABLES). Algn observador para demostrar que no son comparables puede decir lo
siguiente: Mire, si uno de los que recibi placebo se cur, cmo descartar que los tres
que recibieron TTO no se iban a curar as no recibieran nada?
MENOS
REPRESENTATIVO
TOTAL DE
POBLACION
MAS
REPRESENTATIVO
Recuerde que los seres humanos para entender fraccionamos la realidad y construimos
conceptos. Las categoras son fraccionamientos de lo que vemos y que siguen algn
criterio. En las investigaciones categorizamos con el fin de descomponer variables que
puedan ser analizadas. Por ejemplo, si se requiere indagar acerca del nivel
socioeconmico de una muestra poblacional, entonces se busca cul puede ser la variable
que ofrece el mejor dato: los estratos (indicador) parecen ser en este caso y, por ende, la
categora socioeconmica se fracciona como estratos 1, 2 ,3 ,4 ,5 y 6. As, si se pregunta:
Usted a qu estrato pertenece?, la respuesta ser el dato.
Muy seguramente se debe preguntar edad en meses (para as poder comparar por edades
a las dos poblaciones, la que recibe lactancia materna y la que no). Indagar estratos
socioeconmicos, pues claramente pueden influir en una u otra respuesta. Se deber
preguntar por vacunas, pues ellas pueden ser determinantes en la aparicin o no de
algunas enfermedades infecciosas; as mismo, preguntar por episodios de diarrea y de
infeccin respiratoria, por ser las infecciones ms frecuentes de los lactantes, etc. Lo que
se quiere ejemplificar es que para contestar una pregunta tan sencilla, se deben usar una
importante cantidad de variables. Sea este el momento de mencionar que es apropiado
investigar quines se han hecho esta pregunta antes y estudiar los instrumentos
(cuestionarios de variables) que existen, ya que puede ser ms eficiente usar estos que
disear uno nuevo (disear lo que ya otros disearon es una prdida de tiempo).
Las variables, por supuesto, reciben influencia del diseo. Volviendo al
ejemplo en donde la pregunta es: Ser que los lactantes alimentados con
leche materna tienen menos episodios infecciosos que los que no reciben? Si
se escogen dos cohortes de lactantes, unos alimentados con seno y otros
con leches artificiales, la variable puede ser el nmero de episodios de diarrea o
infecciones respiratorias durante el tiempo que dure el estudio y los resultados podrn
ser concluyentes en su relacin con la realidad. No ser as, si se escoge comparar
historias (retrospectivo) de nios que recibieron seno con los que no y ver episodios
infecciosos en un perodo. Ac las dificultades de las historias (que est o no la
informacin) y otras circunstancias, hacen que la posibilidad de dejar pasar elementos
importantes sean mayor que en el primer caso.
Una variable apropiada debe cumplir con una serie de requisitos por
dems lgicos. Sin duda, el principal es que la respuesta que se obtenga
permita ser MEDIDA.
Una medida es una comparacin de alguna condicin que se hace a la
poblacin objeto del estudio y que permite ser entendida. Dicha
comparacin debe, en lo posible, hacerse con unos instrumentos y,
claro, cada vez que se mida a otros sujetos de la investigacin, usar ese
mismo instrumento, usando en lo posible las mismas condiciones de
aplicacin del instrumento.
Disear variables donde sea fcil medir no es tan sencillo. Por ejemplo, el test de APGAR
de la funcionalidad familiar, pretende a travs de la medida otorgada (0 = casi nunca, 1=
a veces y 2= casi siempre) identificar la percepcin de disfuncin familiar. Lo importante
es saber si las medidas se corresponden a la realidad (validacin). De ah que cuando se
construye un instrumento (llmese test) para medir algo, antes de aplicarlo debe pasar
por el proceso de validacin o, lo que es lo mismo, demostrar que ciertamente mide la
realidad. Ello habitualmente se hace confrontando el instrumento con EL INSTRUMENTO
REINA, aquel que nos ofrece la mejor medicin de la realidad en una poblacin. Por
ejemplo, la mejor manera de detectar trastornos de conducta alimentaria (TCA) es la
entrevista psiquitrica. Si construimos un cuestionario para detectar casos, se debe hacer
un estudio tomando una poblacin donde los TCA estn presentes (y, claro, otra donde no
estn no presentes). Se les aplicar el cuestionario, pero adems la entrevista
psiquitrica; luego se confrontaran los resultados verificando qu tan concordante es el
cuestionario con la entrevista psiquitrica. As se hace un proceso de validacin de
instrumento.
2.7.1. Atributos de una medida: Una buena medida debe tener los
siguientes atributos:
CONFIABILIDAD: Es la congruencia que tiene la variable con lo que
mide. Si se desea saber el peso de una persona y se pesa en una
bscula y se obtiene un peso de 75 kilos, se espera que si se vuelve
a pesar se obtendr nuevamente ese peso. La confiabilidad se
obtiene del instrumento de medicin, cumpliendo con la condicin de
que si se vuelve a medir se encuentre lo mismo. Adems, la escala
derivada de la medida debe permitir entender las diferencias entre
una condicin y otra. Por ejemplo, la medida de la talla en
centmetros usando un tallmetro permite, si se mide a un sujeto en
las mismas condiciones, obtener la misma medida y las diferencias
entre centmetros de la escala permiten entender quin de la
poblacin objeto es ms o menos alto.
VALIDEZ: Por validez se entiende que la variable (a travs del dato)
responda a la pregunta de investigacin (mida lo que debe medir).
Otra forma de expresarlo es que la variable mide lo ms cercano a la
realidad. Por supuesto que resulta bastante obvia esta condicin; sin
embargo, no siempre se cumple, pues la validez exige ser probada,
es decir, que la variable ciertamente contesta (o sirve para
contestar) la pregunta de investigacin. Para ello una forma de
hacerlo es validando las variables o lo que resulta ms pragmtico,
usando variables ya validadas de otras investigaciones.
Por ejemplo, el test de APGAR familiar que mide la percepcin del individuo
sobre la funcionalidad de su familia. Es vlido? Sin duda es una percepcin
que refleja lo que percibe el individuo. Pero ser confiable? Es decir, que si
se mide hoy y vuelve y se mide en siete das cambiar? Sera necesario
hacer una investigacin para contestar, pero lo probable es que cambie de acuerdo a
lo que suceda en la relacin del individuo con su familia. Si hoy se hacen las preguntas
del APGAR FAMILIAR y maana se repiten (luego de una discusin del encuestado con
la mam, por ejemplo), puede encontrarse una medida diferente. En ambos casos, lo
que se mide es vlido, pero el test no es confiable: cambia de acuerdo a la situacin.
Esto se conoce como variacin.
Las variables arrojan datos. Del buen manejo que se haga de los datos
depender el entendimiento de los resultados y, por consiguiente, la
posibilidad de una buena discusin. Ese es el papel de la estadstica:
permitir un buen manejo del dato a travs del cual se pueda ver ms.
2.
FEMENIN 1. A VECES 1. A VECES 1. A VECES 1. A VECES 1. A VECES
O
CLAVE
1. EDAD
RESPUESTA
3. NO
ENTIENDE
3. NO
ENTIENDE
3. NO
ENTIENDE
3. NO
ENTIENDE
3. NO
ENTIENDE
PROBABLES RESPUESTAS
LA
PREGUNTA
LA
PREGUNTA
LA
PREGUNTA
LA
PREGUNTA
LA
PREGUNTA
CODIFICADAS
(Datos)
444. NO 444. NO 444. NO 444. NO
NO APLICA
Siglas para
APLICA APLICA APLICA APLICA
Programa
EPINNFO
Consecucin de la poblacin
Se expuso que uno de los criterios de factibilidad ms importante es el
acceso a la poblacin. En salud, la poblacin objeto puede ser enfermos,
o personas con caractersticas particulares. En general, estn agrupados
en algn sitio, tales como instituciones de salud (enfermos), colegios
(adolescentes), hogares comunitarios o clubes de la tercera edad.
Trabajo de campo
Anlisis de la informacin
Presentacin de la investigacin
Ms de una vez los investigadores creen que con solo la revisin del
marco terico la investigacin se podr efectuar. Sin embargo, podemos
asegurar que slo los que planeen bien, tendrn xito.
Paso 1
Paso 2
Por ejemplo, si el problema es Cul es la relacin entre A y B en la poblacin
C?:
1. Describir y explicar qu es A.
2. Describir y explicar qu es B.
3. Describir qu es C.
4. Explicar cmo se relaciona A, con B y con C.
2.
FEMENIN 1. A VECES 1. A VECES 1. A VECES 1. A VECES 1. A VECES
O
CLAVE
1. EDAD
RESPUESTA
3. NO
ENTIENDE
3. NO
ENTIENDE
3. NO
ENTIENDE
3. NO
ENTIENDE
3. NO
ENTIENDE
PROBABLES RESPUESTAS
LA
PREGUNTA
LA
PREGUNTA
LA
PREGUNTA
LA
PREGUNTA
LA
PREGUNTA
CODIFICADAS
(Datos)
444. NO 444. NO 444. NO 444. NO
NO APLICA
Siglas para
APLICA APLICA APLICA APLICA
Programa
EPINNFO
El diseo de la tabla de frecuencia est sujeto a las especificaciones de las revistas, las
que con pequeas variaciones entre s, informan en sus instructivos para publicar las
exigencias pertinentes. Una tabla de frecuencia debe ser titulada con: nmero de tabla
(orden), expresando qu est mostrando, de quin y cundo se obtuvo la informacin.
Debe aparecer antes de empezar a mencionarla. La tabla usada de ejemplo une las
caractersticas de la poblacin con las frecuencias estudiadas en una investigacin sobre
adolescentes escolarizados y riesgos psicosociales en la localidad de Suba en el ao 2006.
YES NO OR IC 95%
HIHG RISK BEHAVIORS
LL UL
Having Being Assaulted in the Past Year
Gender
Male 2 062 (37) 3 574 (63)
1.7 1.51 1.8
Female 1 639 (28) 4 224 (72)
Family
Severe Dysfunction 520 (59) 362 (41)
4.1 3.46 4.75
Functional 1 836 (25) 5 418 (75)
Carrying a Weapon
Gender
Male 752 (13) 4 864 (87)
3.1 2.63 3.57
Female 305 (5) 5 584 (93)
Family
Moderately dysfunctional 299 (11) 2 311 (89)
1.5 1.28 1.77
Functional 524 (7) 6 737 (93)
Eating Disorders
Family
Reconstituted 232 (42) 320 (58)
1.5 1.2 1.8
Blood relationship 1 571 (31) 3 451 (69)
Sexual Relations
Gender
Male 1 266 (22) 4 607 (78)
1.9 1.72 2.15
Female 801 (13) 5312 (87)
Family
Incomplete 875 (19) 3802 (81)
1.1 1 1.27
Complete 1060 (16) 5 690 (84)
Un artculo ideal, sin tablas y sin bibliografa debe tener entre 3000 y
3500 palabras (de acuerdo a la revista). Las revistas biomdicas
imprimen en cada nmero las instrucciones que deben seguir los que
estn interesados en publicar.
Captulo 4
El papel de la
Estadstica:
Construyendo un
idioma entendible
Guillermo Restrepo Ch. Juan Carlos Gonzlez Q 216
Texto Bsico de Biometra
CAPTULO 4. EL PAPEL DE LA
ESTADSTICA: CONSTRUYENDO UN
IDIOMA ENTENDIBLE
La realidad es que el estudio de la salud y la enfermedad en la poblacin
(epidemiologa) se hace utilizando la investigacin y el lenguaje con que
se expresan los resultados es la estadstica. La estadstica es un
conocimiento que se ocupa de describir y analizar los datos. Los datos
son las probables respuestas a las variables y stas, son las
preguntas a travs de las cuales se descompone y se busca la
contestacin del problema de investigacin.
Las variables pueden ser contestadas con datos de distintos tipos. Una
forma de clasificar a los datos puede ser la siguiente:
1. Datos cuantitativos
2. Datos cualitativos
1.1. Discretos
1.2. Continuos
Los datos discretos son aquellos cuya respuesta solo puede emplear un
nmero entero (no permite ms subdivisiones). Por ejemplo, la variable
casos (personas enfermas) de tal enfermedad solo puede ser expresada
con un dato como un nmero entero: no puede decirse que existen 7 y
media personas enfermas Otros ejemplos pueden ser la respuesta a la
NOMINALES
ORDINALES
CUALITATIVOS
INTERVALICOS
PROPORCIONALES
DATOS
DISCRETOS
CUANTITATIVOS
CONTINUOS
Los datos cuantitativos tienen una enorme ventaja sobre los cualitativos y es
precisamente que la estadstica puede trabajarlos mejor. Ya se hablar de esto
ms adelante.
2.1. Nominales
2.2. Ordinales
2.3. Intervlicos
2.4. Proporcionales
Los datos nominales son aquellos que usan respuestas que nombran.
Por ejemplo, el color de tal cosa o cules son las enfermedades ms
frecuentes. Algunos autores crean una subdivisin importante por la
frecuencia, denominada existencial referida a que lo tiene o no lo tiene
(existe o no). Por ejemplo, ante la variable tiene o no cncer. El dato es
14
13
F
12
R
11
E
10
C
9
U
8
E
7
N
6
C
5
I
4
A
3
S
2
1
10 11 12 13 14 15 16 17 18 19 20
EDAD
Cncer No cncer
Si fuma 80 20 100
120 180
ASOCIACION
OR = 16
Las medidas de asociacin buscan las relaciones que pueden existir ente
la causa y el efecto. Todas son el resultado del uso de la tabla de
comparacin o de tabla de 2X2. Son dos. Unas son las medidas de
diferencia que comparan las frecuencias de los expuestos con los no
expuestos. Otras que obtienen razones entre los expuestos y los no
expuestos. Las dos escalas empleadas son el RR o riego relativo
(a/(a+b) c/(c+d)) y el OR o razones de ventaja (ad/bc).
1 ACEROm DUARTE
2,4 51SONIA
DIAZ JENNY
MORA
h 3,8
GERMAN
101 MARTINEZ
DARIO
m 3,8
GARZON
151 ROJAS
LEANDRA
hLIEVANO
3MILENAJHON FREDY
2 ACOSTA1 BELTRAN
3,2 52 DIAZ
EDNAPEREZ
m
PAOLA3,6ADRIANA
102 MARTINEZ
PAOLA
m 2
RAMOS152 ROJAS
MARIAhCONSUELO
ROJAS
2,8 FABIO NORIEL
3 AMADOm AMADO
3 53
LEYVI
DIAZ YEN
PLATA
h 3,4ORLANDO
103 MARTINEZh 3
VARGAS
153 ROJAS
LEONARDO
mTORRES
2,4 LIBIA YUBELLY
4 AREVALO
m 3,4
NOSSA 54PAOLA
DIAZ RONCANCIO
m
CATALINA
3,4 104 BIBIANA
MARTINEZ
h 3,2
ZARATE
154 ROMERO
SANTIAGO
m BONILLA
3,4 JENNY MARC
5 ARIZAmALTAHONA
3,8 55 MARIA
DUARTE hDEL
SALAMANCA
3PILAR
105 MEDELLIN
LUIS
m ALBERTO
2,8
MARTINEZ
155 ROMERO
LINAh PAOLA
GUTIERREZ
2,2 RENE ALE
6 ARIZA h
AGUILAR
4,6 56
LUDWING
DUQUE mOLIVER
LIZARAZO
3,2 106 LOURDES
MEDINA h BUSTOS
3,2 156JORGE
ROMERO h
ALONSO
OROZCO
2,8 MANUEL GUI
7 ARIZAmSAAVEDRA
2,8 57 MAGDA
ECHEVERRY
mNATALIA
2,6 CARDENAS
107 MEDINA mCLAUDIA
SILVA
3,4 157CLAUDIA
CECILIA
ROMERO PATRICIA
m PISCO
2,2 LILIANA ANDRE
8 ARRIETA
h NINO
3,6 ARNOLD
58 ECHEVERRY
ALEJANDRO
m 3,4 DIAZ
108 TATIANA
MENDOZA
m 3,2
JAIMES
158 JACKELINE
RONCANCIO
h 2,8 REY NEIL JAHIRZ
9 ARTUNDUAGA
h 2,8 LOZANO
59 ESLAVA OLIVERIO
m CLAROS
3,4 109MARIAN
MENDOZA
mJOHANALATORRE
3 159 RONCANCIO
MARIA
m ALEXANDRA
3 REY ROSSY MARYO
10 BALLESTEROS
m 3,8 QUINTERO
60 ESPITIA h CLAUDIA
COLMENARES
3 110LIZETH
MOLANO
DIEGO
h ZARATE
3,6ALEJANDRO
160RUBEN
ROZOm HURTADO
EDUARDO
3,4 SANDRA MILEN
11 BARRERA
m 2,8
BARRERA
61 ESTUPINAN
OSCARm ANRES
3,6PIEDRAHITA
111 MORENO m CONSTANZA
BELTRAN
3,4 161 SANABRIA
PAOLA
MARCELA
m 3,6
DELGADO ILSE YANIV
12 BARRERA
m 2,8
CASALLAS
62 FALLA
DEYSYhCASTELLANOS
3,4
CAROLINA
112 MORENO
NELSON
h CASTANEDA
4,2FERNANDO
162 SANCHEZ
NESTOR
m 3,2
AVILA
ALBERTO
DERLY JEANINN
13 BARRERA
h 2,8
CORTES63 FARFAN
HECTOR m NIETO
ANTONIO
3,2 113
VICTORIA
MOYAm VELANDIA
EUGENIA
1,8 163 SONIA
SANCHEZ
CAROLINA
m 3,8
GUTIERREZ ANGELICA
14 BELLOmGONZALEZ
3,6 64 LIDA
FLORIANFABIOLA
m DIAZ
3,2 YEIMI
114 NEGRETE
CAROLINA
h 2,6
LEVETTE
164 SANCHEZ
JORGE h ANDRES
3,6
PEREZ CARLOS ANDR
15 BELTRAh AVILA
3 MAURICIO
65 FLORIAN mORLANDO
RODRIGUEZ
2,4 115 NEVA MARIA
mJARAMILLO
2,8
ISABEL165GINA
SANGUINO
VIVIANA
h 2,4
DELGADO GIOVANNI
16 BELTRAN
m OCHOA
2,8 66LAURA
FONSECA hMELISA
3,4
PLATA
116ANDRES
NOVOA mLEONARDO
BOLIVAR
2,4 166ERIKA
SOSAMARIA
mSANCHEZ
3 LILIANA PATRIC
17 BELTRAN
m SARMIENTO
3 67 FUENTES
CATALINA
h 3,2
BONILLA
XIOMARA
117 OLARTE
CRISTIAN
m RUIZBERNARD
3 SAYDA
167 SOTOPATRICIA
h
BASTIDAS
3 JORGE ENRIQU
18 BENAVIDES
h 2,8VALDERRAMA
68 FUENTES m DIEGO
SUAREZ
3 118
ALEJANDRO
OLARTE
AILEENm TATIANA
SILVA
3,4 168ANATOBO
MARIA h
CORREA
2,6 LUIS GIOVANNI
19 BENITEZ
m RUIZ3 LILIANA
69 GALVISPATRICIA
h PADILLA
3,2 119MARTIN
ORTIZh FRANCISCO
BELTRAN
3,4 169 DIEGO
TORRESORLANDO
m CHAVES
2,8 VENUS BIBIAN
20 BONILLA
m MORA
3,2 70
ORNELLA
GARAY h FERNANDEZ
3,6 120 PANESSO
MANUEL
m 3,4
PULGARIN
ANDRES
170 TOUSPAOLA
mCHINA
ANDREA
3,2 LILIANA BEATRIZ
21 BRUGESh CARRI.LLO
3 71 GARCIA
EMILIOm CABALLERO
JOSE
3,6 121 PARADA
AURAm LUZ
DUARTE
2,8 171MIRYAM
TRUJILLO
m JOSEFA
3,2
RODRIGUEZ ANDREA
22 BUITRAGO
m 3,2
MERIZALDE
72 GARCIA DIANA
h DIAZ
3,2
KATHERINE
RUBEN
122 PAREJA
DARIO
m HURTADO
3,4 172 URIBE
ERIKAhHENAO
MARGARITA
2,8 MANUEL ALBERTO
23 BUITRAGO
h 2,6
MONSALVE
73 GARCIA LUIS
h VASQUEZ
GABRIEL
3,2 123 VICTORIA
PEDROZAh 2,4
EUGENIA
SABOGAL
173 URRIAGO
SERGIO
h 3,2
SANTOS
ENRIQUEFELIX EDGAR
24 CAICEDO
h PEREZ
2,8 74JORGE
GARZON m
HERNAN
NINO
2,4 124
DIANAPENA
FERNANDA
mBERMUDEZ
3,4 174 JOHANNA
VALCARCEL
h MERCEDES
3,4VELA JOSE RODRIG
25 CAJICA
m ALVARADO
2,8 75 GARZON
JUANITAm QUINTERO
BIBIANA
4,2 125 PERDOMO
ADIELA
h 3
PUENTES
175 VALDERRAMA
ISMAEL
m 3,6
OSIRISZULUAGA JOHAN
26 CALDERON
h 3,4
BARRERA
76 GARZONSANDER
h ROMERO
4,2DAVID
126 PERDOMO
HECTORm JAVIER
3,4
TOVAR176 VICTORIA
VALDES m BORDA
EUGENIA
3 ALEXANDRA
27 CALVO h PREZ
3,8 ALEJANDRO
77 GODOY m ESPINOSA
3,4 127 PEREZ
JANNETTE
hCORTES
2,4 IVONNE
177
RICARDO
VARGAS mANDRES
CARDOZO
2,6 MARIA ALEX
28 CANONm GOMEZ
4 78
DIANA
GOMEZIVONNE
m BAUTISTA
3 128 JENNY
PERILLA
mVIVIANA
MUNOS
3,4 178 ADRIANA
VARGAS m PATRICIA
GONZALEZ
2,6 CRIST ELIZA
29 CARDENAS
h 2,6
RIVEROS
79 GOMEZCARLOS
h BERNAL
2,6
JAVIER
129
ANDRES
PINEDAmEDUARDO
RODRIGUEZ
3,2 179 VELEZ NADIA
mRAMIREZ
CAROLINA
3 CAROLINA
30 CASTANEDA
h 2,6 AMAYA
80 GOMEZ
FELIX h DUARTE
EDUARDO
3,4 130GIOVANNY
PINZONm PARRA
ALBERTO
3,6 180 MARGARET
VICTORINO
h IVONNE
3,2
PERILLA OSCAR JAV
31 CASTANO
h 3,6
LORA81 LUIS
GOMEZ
FERNANDO
m GALLEGO
3 131 MARIA
PORTILLA
h
PAULA
3,8
MOGOLLON
181 VILLALOBOS
FABIAN
m 3,2
ANDRES
RODRIGUEZ MARC
32 CASTIBLANCO
h 2,8 RUIZ
82 GOMEZ
EDWIN m LIZARAZO
FERNEY
2,2 132 FRANCY
PUERTOm RODRIGUEZ
3,4 182 ZAMOJCIN
CAROLINA
m 3,6
RODRIGUEZ MONIKA
33 CASTILLO
m 3,6
GUERRERO
83 GOMEZ JANETH
m LOPEZ
3,6ROCIO
133
CLAUDIA
PULIDOm
PATRICIA
OVALLE
2,2 ERIKA
34 CASTILLO
h 3,2
WISMAN84 GOMEZ
MARIO m ANDRES
NAVARRO
3,2 134 ANDREA
QUESADA
m DEL3,6
NUNEZ
PILARBESELINK
35 CASTRELLON
h 3,6 FELIZZOLA
85 GOMEZ mCARLOS
RODRIGUEZ
3,2 135
ALBERTO
QUIMBAYO
MABEL
m NAYIBE
3 CORTES CLAUDIA LILIANA
36 CASTROh VELASQUEZ
2,6 86 GUTIERREZ
HOLMEN
h 3,8ARLEM
CORTES
136 QUINTERO
ANDRES
m 3,6FONNEGRA
FELIPE ALESSANDRA JOHANA
37 CIFUENTES
m 2,8CASTANEDA
87 HERNANDEZm
ROSA 3,6ANGELA
FUENTES
137 RAMIREZ
ANDREA
h ARBELAEZ
3,2 OSCAR DAVID
38 CORREA
m DIAZ
3,4 RUTH
88 HERRAN
LILIANA
h ARAQUE
3,4 138 DIEGO
RAMIREZ
m FERNANDO
MORA
3,2 MARIA PAULA
39 CORREAL
m 2,8
TOVAR 89PAOLA
HOYOS hCAROLINA
BELTRAN
3,8 139FRANCISCO
RAMIREZ
m PRECIADO
3,8JOSE CLAUDIA MARCELA
40 CORREDOR
m 3,4SUAREZ
90 JAIME
SANDRA
mRINCON
3MILENA
140
SANDRA
RAMOS MILENA
h CABRERA
2,6 PEDRO JOSE
41 CORTES
m DIAZ
3,4 ANA
91 KUAN
BETULIA h
CASAS 3 HERNANDO
141 REINAm FAJARDO
2,4 DIANA PAOLA
42 CUADROS
m 2,8
OROZCO
92 LONDONO
JASBLEIDY
m 3,6
GUATEQUE
142 REYALEXANDRA
ORTIZ
m 2,2SANDRA MARCELA
43 CUBILLOS
m 2,4
CHAVEZ
93 LOPEZ
JOHANNAmMERCADO
3
ANDREA
143 INGRID
RINCONm ALBARRACIN
3 SANDRA PATRICIA
44 CUELLAR
m ENCISO
2,8 94 TATIANA
LUGO h CAROLINA
3,6 144 RINCON h COLLAZOS
3,4 ALFREDO ALBERTO
45 CUERVO
m ARIAS
3,2 95
ANGELICA
LUGO h RAMOS
YANIRA
3,2 HECTOR
145 RIVEROS
LEONARDO
m VARGAS
2,8 CLARA INES
46 CUINEME
m MORENO
3 96 LUNA
SANDRA m
AVILAPILAR
3,8TATIANA
146 ROCHA
MILENA
m ACERO
2,2 MAGDA LIZETH
47 DANGOND
m 3
GOMEZ97 MARENTES
GINNA mVANNESSA
3,8
DIAZ
147CARMEN
RODRIGUEZ
mMARYLIN
3,4CONDE JOHANA ASTRID
48 DELGADO
m 3,2
CARDONA
98 MARROQUIN
LIDSAY
h 2,6
AIRINY
CARRILLO
148 RODRIGUEZ
HUGO
m 3,2ALEXANDER
GARZON CEILA
49 DELGADO
h 2,4
LORDUY
99 MARRUGO
OMAR mEDUARDO
3,4
PADILLA
149 RODRIGUEZ
KATHERINE
h 3,6PORRAS
TATIANAEDWIN ANTONIO
50 DIAZ HERNANDEZ
h 3,4 100 JORGE
MARTINEZhANDRES
2,8
CONTRERAS
150 RODRIGUEZ
MIGUEL
m 3,8VILLAMIL NELLY JANNETH
En una base de datos se trascriben los datos de las variables. En este caso la base est
constituida por la columna de enumeracin de los sujetos, por la identificacin, por el
gnero y la calificacin que obtuvieron. Si la base se ordenara, una buena cantidad de
informacin presente se pondra al alcance de los ojos.
Datos
EDADES N %
De 10 A 12 aos 3965 32
De 13 A 16 aos 7200 59
De 17 A 19 aos 997 8
Variables GENERO N
6274
%
51
Mujeres
ESTRATO N %
Estrato 1 347 3
Estrato 2 Indicadores 8958 73
Estrato 3 2475 20
ESTRUCTURA FAMILIAR N %
Nuclear completa 6862 56
Nuclear incompleta 3774 31
Recompuestas 1112 9
Hogares donde faltan ambos padres 227 2
FUNCIONALIDAD FAMILIAR N %
Buena funcin familiar 7722 63
Disfuncin moderada 2731 22
Disfuncin severa 920 7
21.600.000,0
21.400.000,0
21.200.000,0
21.000.000,0
20.800.000,0
20.600.000,0
20.400.000,0
20.200.000,0
1 2
1
2
6 6 0
7 3 0
8 18 3
9 11 3
10 51 14
11 84 31
12 166 82
13 215 89
14 233 172
15 202 176
16 104 127
17 25 29
18 3 7
19 2 3
20 0 2
Total 1123 738
informacin, observe este ejemplo: En un estudio sobre 12 302 adolescentes
(entre 10 y 19 aos) de colegios pblicos se les pregunt a qu edad tuvieron la
primera relacin sexual. La pregunta fue contestada por 1 871 jvenes (que
afirmaron haber tenido relaciones sexuales) y se estratific por gnero. La tabla y la
grfica de barras se presentan a continuacin:
Y la grfica de barras:
250
200
150
hombres
FC 100 mujeres
50
0
6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Edad
En el eje de la Y est el nmero de casos que afirman haber tenido relaciones sexuales
(50, 100 etc.).En el eje de las X estn las edades y en azul los hombres comparados con el
rojo que son las mujeres. Por cierto alarmante lo expresado!... Segn esta tabla el inicio
de la actividad sexual se hace a los 6 aos en el hombre y 8 en la mujer: ser que han
sido abusados sexualmente?
3.000
2.500
N DE MUERTOS
2.000
HOMBRES
1.500
MUJERES
1.000
500
-
1 2
AOS COMPARADOS
PERIODO DE INCUBACION
3:21
2:52
2:24
TIEMPO
1:55
INCUBACION
1:26
0:57
0:28
0:00
0 5 10 15 20 25 30 35 40
CASOS
Este croquis muestra cmo Snow expuso a travs de puntos los lugares
donde aparecan los casos de clera en la epidemia de 1849. Sin duda,
no existe una mejor forma de exponer que existe una relacin entre los
casos y la ubicacin geogrfica.
30
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
1,8 1,9 2,0, 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6
El histograma permite ver muchas cosas las notas extremo (alta y baja), la que ms se
repite y, casi permite identificar, la nota promedio Por supuesto que es el histograma la
base de la grfica de barras. Realmente es una maravilla de grfica cierto?
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
1,8 1,9 2,0, 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
1,8 1,9 2,0, 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6
1.
Son muchsimos los ejemplos de la utilidad de la media en epidemiologa e
investigacin. Por ejemplo:
4.3.3.2. La moda
Cuando se estudia un comportamiento en una poblacin, puede haber
alguno (casi siempre lo hay) que se repita ms que los dems. Eso es lo
que se denomina la moda. En el ejemplo de las calificaciones, el 3,4 es
la nota que ms se repite.
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
1,8 1,9 2,0, 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6
4.3.3.3. La mediana
30
29
28
27
26
25
91 91
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 4,6
Retomando el ejemplo de la sobrevida del cncer, en donde la media fue de
cinco aos, otra pregunta puede ser en qu momento la mitad de la poblacin
est muerta (y, por ende, la otra mitad viva). Para ello, supongamos que el
total de poblacin (casos) fue de 50. En el ao 4,5 estaban vivos 25 y ya
haban fallecido los otros 25, entonces ese ao (4,5 fue el ao en que dividi a la
sobrevida en dos).
91 91
29
28
45.5 45.5 45.5 45.5
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
1,8 1,9 2,0, 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6
La grfica expresa un histograma donde aparecen los 182 datos. La nota (dato) que divide
a la poblacin en dos mitades fue 3.1. Quiere decir que hacia un lado hay 91 alumnos con
sus calificaciones y lo mismo hacia el otro. La calificacin 2.8 divide a las poblaciones otra
vez en dos mitades. La calificacin 3.6 hace lo propio con la otra mitad. Esto se conoce
como CUARTILES que es la divisin de la mediana en dos mitades. Sirve para tener
referentes de ubicacin. Por ejemplo, entre qu calificaciones estuvieron el 25% de los
alumnos que sacaron las calificaciones ms bajas y el 25% de los obtuvieron las
calificaciones ms altas. A propsito, esta es una medida de dispersin que ser explicada
un poco ms en las pginas que siguen.
4,5
3,5
3
Notas
2,5
1,5
0,5
0
0 50 100 150 200
# de alumnos
4.3.4.1. El recorrido
En este referente, se usa la distancia entre los dos lmite de los rangos o
lo que es lo mismo, la diferencia entre los valores extremos.
25 % 75 %
30 50 %
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 4,6
45 notas = 25%
91 notas = 50%
136 notas= 75%
182 notas =100%
No se confunda con el cambio de aspecto de la grfica en este captulo. A veces es ms
ancha otras ms angosta slo por el efecto de la forma como se est pegando la imagen al
texto.
Retomando el ejemplo de las notas, se observa que los rangos son 1,8 y
4,6. Por ende, el recorrido es de 2,8 o, lo que es lo mismo, las
calificaciones en este grupo tuvieron una dispersin comprendida entre
1,8 y 4,6 con un recorrido de 2,8 (esa es la diferencia entre los dos
extremos). Imagnense que los extremos estuvieran entre 0,5 (en vez
de 1,8) y 4,9 (en vez de 4,6). Ac el recorrido sera de 4,4. Entonces se
puede afirmar que la dispersin de las notas del grupo que obtuvo 2,8
es menos que la del grupo que obtuvo un recorrido de 4,4. Claro, entre
menor sea el recorrido, el comportamiento de los datos tiende a ser ms
parecido (ms homogneo).
Un ejemplo clnico puede ser el anlisis de definir cundo aparece un efecto
de un medicamento. Por ejemplo, cul es el recorrido del efecto de un tipo de
insulina (para bajar la glicemia) en una poblacin de diabticos. Pregntese
en cul existe una mayor ventaja para prescribirla: 1) Si tiene un recorrido
muy amplio. Por ejemplo, entre 1 hora y 6 horas lo que da un recorrido de 5 horas. 2)
O si el efecto se presenta en la mayora de la poblacin en un recorrido estrecho. Por
ejemplo, entre 1 y 2 horas (rangos) con un recorrido de 1 hora. Probablemente la
respuesta es que es mucho mejor tener recorridos estrechos pues as ser ms fcil
construir la prescripcin (o forma como se debe suministrar).
Por ejemplo, se tiene un estudio de un colegio donde la edad media de la
poblacin es de 13 aos y se ha estudiado una cantidad de variables sobre
vida sexual. La pregunta es: Si se compara con otro colegio se puede
hacer? La respuesta depende de crear diferentes variables a travs de las
cuales se pueda ver que la poblacin de un colegio y otro son COMPARABLES, pues si
son diferentes no se podrn hacer comparaciones; una de las variables que hace
comparable o no a dos grupos es la edad media: claro, si voy a preguntar sobre inicio
de vida sexual en ambos colegios para luego comparar, resulta clave que las edades de
ambos sean similares; ah ciertamente si existe diferencia me permitir hacer anlisis
que expliquen por qu, pero si en uno de los colegios la edad media es de 13 aos y en
el otro de 17 aos, las diferencias que encuentre se pueden explicar por la edad (no
vale la pena dar otras explicaciones, pues estos grupos por edad no son comparables).
N-1
Como quien dice la DS nos hace saber que todos los datos comprendidos entre los datos
lmites productos de aplicar dos DS, pertenecen a un mismo grupo. Piense por un
momento en lo siguiente: imagnese que al examinar la respuesta de un medicamento
contra la fiebre en una poblacin se obtuvo que la control con una media de tiempo de 15
minutos despus de administrado. Al aplicar dos DS se obtuvo unos lmites entre 7 min y
22 min. De ello se puede afirmar que el comportamiento de este medicamento contra la
fiebre permita hacer esperar su efecto entre 7 minutos y 22 minutos. Esto es lo esperado
y cualquier tiempo entre 7 y 22 minutos forman parte de ese esperado.
95%
67%
2.1
2,19 3.1
3,1 4.1
4,07
Ahora imagnese que un alumno sac una nota de 4,6. Comparado con
el referente de la curva de distribucin normal se afirma que dado que
est por fuera de la curva (configurada con dos desviaciones estndar)
esta nota presenta DIFERENCIA SIGNIFICATIVA desde el punto de vista
de la estadstica con las del grupo. Por ende, su comportamiento es
diferente. Por qu? Ah se plantean explicaciones. Muy seguramente
(y planteando una hipottica explicacin) la forma de estudiar del sujeto
que la obtuvo es diferente a la de los dems, por ello su calificacin fue
diferente.
95%
67%
2.1
2,19 3.1
3,1 4.1
4,07
Por qu? Sencillamente porque esa es la nica manera de estar seguro que lo que se
encuentre al terminar la investigacin es debido a la INTERVENCION EDUCATIVA y no a
que desde antes existan diferencias entre los grupos.
DISTRIBUCION
DE LA POBLACION
. EN EL PESO
JOVEN DE 15 AOS
CON UN PESO DE 65
KILOS, UBICADO EN EL
QUARTIL 3 (75%)
(O EN DECIL 7)
TALLA
PESO
DE 15 AOS USANDO LAS TABLAS DEL CDC
DISTRIBUCION 97%
3%
CON 2 DS
56 KILOS
EDAD 42 KILOS
PESOS
83KILOS
DISTRIBUCION
3% CON 2 DS 97%
56 KILOS
DISTRIBUCION
3% CON 2 DS 97%
56 KILOS
Por ejemplo, cuando incluyendo a todas las entidades de educacin (100%) se hace un
examen y con base en los resultados se mira la ubicacin de una entidad con respecto a
todas las dems, se puede afirmar que est en el cuartil inferior, o en el medio inferior o
medio superior o en el cuartil superior.
DISTRIBUCION
DE LA POBLACION
. EN EL PESO
JOVEN DE 15 AOS
CON UN PESO DE 65
KILOS, UBICADO EN EL
QUARTIL 3 (75%)
(O EN DECIL 7)
o Que su peso (65 kilos) est en el percentil 75%, es decir, que los
jvenes con peso normal pero, sin embargo, por encima de l
(ms peso) son un 25% y que l tiene un peso mayor al 75% de
los jvenes iguales a l en edad sexo y regin (normales
estadsticamente). Si se quisiera expresar su ubicacin con
respecto a la poblacin en cuartiles, es el tres donde se ubica.
Obviamente la importancia de esta aplicacin de las curvas de
distribucin normal ha sido y es inmensa. Por ejemplo, al hacer
seguimiento de los nios por edad, podemos ver cmo va ocurriendo el
incremento del peso en relacin con la edad y ver si se hace dentro de
los lmites esperados; si no es as, nos hace sospechar que algo no est
bien en el nio y se busca.
A =B NULA
A =B ALTERNA
Primera comparacin:
Grupo A vs. grupo placebo que asume la letra B. La pregunta hipottica
es:
Existe diferencia en la mortalidad entre el grupo A y el grupo B?
Usando las medias de mortalidad de una vez se ve que existe una
diferencia clnica muy evidente: el grupo A tiene una media de
mortalidad a un ao del 15% en tanto el grupo B (o placebo) tiene una
MORTALIDAD
No Si
A=grupo a 85 15 100
B=placebo 20 80 100
105 95
Valor de la p
Tambin puede usar el Chi (Ji) cuadrado, evidencia que las p son
menores de 0.05 (de hecho son menores de 0.000000) o lo que es lo
mismo que la p (posibilidad) de que este resultado sea debido al azar es
menos de 0.000000, es decir, prcticamente imposible.
4. La interpretacin que se hace es que A es diferente de B
estadsticamente (Hiptesis alterna) y traspasado al idioma de la
investigacin que los pacientes tratados con A vs los tratados con
placebo mueren menos estadsticamente. Como quien dice A
beneficia a los pacientes al ser comparado con el placebo.
-2DS +2DS
. ..
. .
. .... . ..
. . .. . . .
. . . . . . . . .. .
IC 95%12 IC 95%16
Media: 14
La edad media de los adolescentes del colegio A fue de 14 aos y el 95% del grupo
est entre las edades de 12 aos (lmite inferior del IC de 95%) y 16 aos (lmite
superior del IC de 95%).
-2DS +2DS
. ..
........ ..
. . .. . . .
. . . . . . . . .. .
IC 95%12,5 Media: 13,5 IC 95%17
La edad media de los adolescentes del colegio B fue de 13,5 aos. El 95% de los
jvenes estn entre 12,5 aos y 17 aos (lmites de los intervalos de confianza).
.. ... .. .
. .......... ..
. .. ... .. . .
. .. . .. . .. . . . . ..... .
Ahora la pregunta es de si estas dos poblaciones son IGUALES en torno a la edad, ello con
el fin de saber si se pueden comparar. Entonces, y para responder, obsrvese lo que
sucede al interponer las dos curvas:
Como se observa existe una gran parte en donde las dos curvas se encuentran y dos
pequeas franjas en donde no se encuentran. La siguiente grfica lo representa:
12,5 17
..
12 .. ...... 16
. .. .. . ....
. . . . . . . . .. .
Resulta obvio que en las franjas oscuras estas dos poblaciones no son comparables en lo
referido a la edad. Por qu? Pues el colegio B no tiene adolescentes entre los 12 y los
12,5 aos y el colegio A no los tiene entre 16 y 17 aos (cmo se compara lo que no se
tiene?). Pero, as mismo, resulta evidente que comparten las edades entre 12,5 y 16 aos
que por cierto son la mayora de la poblacin de ambos colegios (proporcin mayor de
ambas curvas). Ahora, y trasladando esto al lenguaje de la estadstica, la pregunta que se
hace es: Tomando como referente las edades
1. A es = B
2. A es diferente de B
12,5 17
..
12 .. ...... 16
. .. .. . ....
. . . . . . . . .. .
Estadsticamente se ha establecido que dos poblaciones (A y B) son similares en torno a
un criterio (la edad en este caso, entonces la edad promedio de A es = a la edad promedio
de B) si las diferencias entre ellas no son mayores de un 5%. Ello quiere decir que A es =
a B si las dos franjas oscuras no son mayores de un 5 %.Otra manera de expresarlo es si
las curvas coinciden en ms de un 95%.
Ahora prubese y construya la tabla comparativa y saque la prueba p para dar respuesta
oficial de si A es = B o A es diferente a B.
SI PRESENTE NO PRESENTE
VARIABLE
Si presente a b
INDEPENDIENTE
No presente c d
a+c b+d
REALIDAD
(A es = B) (A es diferente a B)
ENFERMO
SI NO
ENFERMOS SANOS
CASOS ARROZ ENSA SALC POST CASOS ARROZ EN SAL POS
1 1 1 1 1 1 1 0 1 1
2 1 1 1 1 2 0 0 1 1
3 1 1 1 1 3 0 0 1 1
4 1 1 1 1 4 0 0 1 1
5 1 1 0 1 5 0 0 1 1
6 1 1 0 1 6 0 0 0 1
7 1 1 1 1 7 1 0 0 1
8 1 1 0 1 8 1 1 1 1
9 1 1 0 1 9 1 1 0 0
10 1 1 0 1 10 1 0 0 1
11 0 0 0 0 11 0 0 0 1
12 1 1 1 1 12 1 0 0 1
13 1 1 1 1 13 0 0 0 1
14 1 1 0 1 14 0 0 1 1
15 1 1 0 1 15 0 1 0 1
16 1 1 1 1 16 0 0 1 1
17 1 1 1 1 17 1 0 1 1
18 1 1 0 1 18 0 0 1 0
19 1 1 0 1 19 0 0 1 1
20 1 1 1 1 20 1 0 0 1
21 1 1 1 1 TOTAL 8 3 11 18
22 0 0 0 0 NO
23 1 1 1 1 CONTACTO 12 17 9 2
24 1 1 1 1
25 1 1 1 1 ENFERMO NO ENFERMO
26 1 1 1 1 CON COMIDA CON COMIDA
27 1 1 0 1 SIN COMIDA SIN COMIDA
28 1 1 1 1
29 1 1 1 1 30 8
30 0 1 0 1 ARROZ 4 12
31 1 1 1 1
32 1 1 1 1 32 3
33 1 1 1 1 ENSALADA 2 17
34 0 1 0 1
TOTAL 30 32 20 32 20 11
NO SALCHICHA 14 9
CONTACTO 4 2 14 2
32 18
POSTRE 2 2
La grfica muestra la base de datos de los sanos y enfermos y las comparaciones bsicas
entre los distintos alimentos. En la parte inferior derecha se compara con cada alimento
quines se enfermaron y quines no.
Luego de ser atendidos los casos (que fueron 34 los que se enfermaron)
en urgencias y descartar la gravedad del episodio para sus vidas, se
hace necesario identificar cul pudo ser el alimento responsable de esta
intoxicacin. Entonces se ha de comparar las personas que se
enfermaron (casos = 34) con las que no se enfermaron (20 en este
ejemplo). Ellas constituyen la variable dependiente. Y luego se deber
comparar con cada uno de los alimentos expuestos. Qu se espera
encontrar? Que uno de esos alimentos est presente en los casos (ms
presente) y ausente en los que no se enfermaron (menos presente). Ello
permite sospechar que sea el responsable. Para ello la tabla es
particularmente til.
Analice cmo se organiza la tabla de comparacin: la variable
independiente es en este caso arroz, ensalada, salchicha y postre, que
son los alimentos consumidos, y debern pasar cada uno como variables
independientes o de exposicin por los participantes en esa fiesta. Lo
que se va a comparar es si comer versus no comer es un riesgo para
enfermarse (variable dependiente). La pregunta es que si comer (A) da
lo mismo que no comer (B) para que se presente la situacin de
enfermarse o lo que es lo mismo:
1. Ver si comer tal alimento (A) es = a (B) no comer tal alimento; es
decir, el alimento no determina la diferencia entre enfermarse o no).
2. A es diferente a B (el alimento s marca la diferencia entre
enfermarse o no).
Lo cierto es que se deber hacer una comparacin de cada uno de los
alimentos. Al usar el programa EPI INFO con uno de los alimentos, en el
cual se puede hacer uso de la tabla de 2x2 y que obtiene las medidas de
RR, de OR con sus respectivos intervalos de confianza y, adicionalmente
con la prueba chi cuadrado, se obtuvo:
ENFERMOS TABLA MEDIDAS Intervalos
de confianza
SI NO
OR RR
ENSALADA
+ Disease - Analysis of Single Table
Odds ratio = 90.67 (11.13 <OR< 1080.22*)
+ 32 3 35 Cornfield 95% confidence limits for OR
*Cornfield not accurate. Exact limits preferred.
- 2 17 19 Relative risk = 8.69 (2.33 <RR< 32.35)
Taylor Series 95% confidence limits for RR
E 34 20 54 Ignore relative risk if case control study.
x
Valor de la
p Chi-Squares P-values Prueba de la p
SI NO o
COMIERON s Uncorrected : 34.56 0.0000000
u Mantel-Haenszel: 33.92 0.0000000
r Yates corrected: 31.18 0.0000000
El programa EPI INFO slo requiere que se llenen las casillas de DISEASE y EXPOSUR y
arroja las MEDIDAS (OR y RR) con sus respectivos intervalos de confianza, as como el
valor de la prueba p. Luego de aplicarlo y obtener las comparaciones (datos que usted
puede sacar de la base de datos previa) se encontr:
Intervalos de confianza
ARROZ Limite inferior Lmite superior
OR 11,25 2,42 57,57
RR 3,16 1,33 7,5
valor prueba p 0,00001779
Intervalos de confianza
SALCHICHA Limite inferior Lmite superior
OR 1,17 0,33 4,12
RR 1,06 0,70 1,61
valor prueba p 0,78370000
Intervalos de confianza
POSTRE Limite inferior Lmite superior
OR 1,78 0,16 19,75
RR 1,28 0,47 3,49
valor prueba p 0,57680000
O al azar queriendo decir con ello que a pesar de salir ese riesgo,
no es la ensalada el alimento responsable, pues de repetirse el
estudio casi con seguridad saldra otro alimento.
(Y se est repitiendo)
Ciertamente esos dos usos son con mucho los ms frecuentes al menos
en el contexto de las investigaciones. El comparar dos grupos de
poblacin y comparar dos resultados, resultan ser en la prctica de la
biometra los campos donde se aplican con mayor frecuencia estas
pruebas de significancia.
Esperamos que quede entendido que tanto los IC del 95% como la
prueba p son dos formas de interpretar lo mismo. Ambas son pruebas
de SIGNIFICANCIA y juntas se correlacionan. Si los IC del 95%
expresan que existe diferencia significativa, entonces la prueba de la p
es menos de 0,05 y si la prueba de p es mayor de 0,05 entonces se
interpreta como que no existe diferencia significativa y los lmites de los
IC de 95% de seguro cruzan el 1.
Conclusin A = B
Comer da lo mismo que no comer
RR= 1,06
. .. .
. .. ..
IC 95%: 2,3 IC 95%: 32,5
RR: 8,6
Intervalos de confianza
SALCHICHA Limite inferior Lmite superior
OR 1,17 0,33 4,12
RR 1,06 0,70 1,61
valor prueba p 0,78370000
Intervalos de confianza
POSTRE Limite inferior Lmite superior
OR 1,78 0,16 19,75
RR 1,28 0,47 3,49
valor prueba p 0,57680000
En el caso del postre el riesgo es de 43%. Dado que para que sea
SIGNIFICATIVO la p ha de ser igual o menos de 5% (o en nmero igual
o menos de 0.05) se considera que estos dos alimentos no presentan un
riesgo SIGNIFICATIVO).
sospechoso, no lo es como para asegurar que est cargada, ya que no cumple con
el requisito de tener una p = o menor de 0.05.
3. Y al lanzarla por tercera vez, qu posibilidad existe de salga nuevamente cara? Ya
ac la posibilidad de que salga cara es slo de un 6.25 % (p de 0.062) resultado de
multiplicar el 0.25x0.25). La sospecha de que est cargada es grande si llega a salir
cara nuevamente (la posibilidad de que no saliera (q) sera de un 93.8% resultado
de restar 100% - 6.25%).
4. Y qu posibilidad que al lanzarla por cuarta vez, vuelva y salga cara? Ahora la
probabilidad de que sea por el azar se ha reducido a un 0.39 % (p de 0.0039 =
0.062 x 0.062). Si sale cara, prcticamente ya no tenemos duda de que est
cargada (la posibilidad de que est cargada es = 100% - 0.39% = 99.6%).
5. Y qu posibilidad existe de que salga cara si se lanza por quinta vez. Es tan slo de
una p de 0.0000015 (resultado de multiplicar 0.0039 x 0.0039). O sea que la
posibilidad de que est cargada es de un 99, 99984%.
Entonces lo que se plantea desde las hiptesis es que A (posibilidad que salga cara) es
diferente a B (posibilidad que salga sello) con una p de 0.0039 que se da a partir de la
cuarta vez que da cara de manera consecutiva. En general, y cuando se aplican las
pruebas estadsticas que arrojan las probabilidades, se dice que A es = a B si la p es
mayor de 0.05 y cuando es igual o menos de 0.05 es SIGNIFICATIVAMENTE
DIFERENTE.
Las tablas estadsticas aparecen al final de los libros (de estadstica). De acuerdo a la
prueba que se emplee se usa la tabla de referente.
NOTA: Si bien este texto no se detendr a explicar cmo se usan las tablas estadsticas,
el concepto que espera quede en el lector, es cmo se interpreta.
Valor de
comparacin p de 0,05
Grados E=60/100
De libertad
O=40/100
2
(E-O)
=7
E
1. La comparacin
Poblacin Investigador A Investigador B
Sistolica Diastolica Sistolica Diastolica
1 130 70 130 70
2
3
120
140
80
90
130
140
80
90 Ser que existe diferencia
4
5
125
120
85
80
120
130
90
75 Entre investigador A con B?
6 140 60 130 65
7 150 80 140 80
8 120 80 130 80
9 130 80 130 80
10 120 70 120 75
Promedios 129,5 77,5 130 78,5
2. Aplicando la prueba T
Sistolica Diastolica
dm A Varianza dm A Varianza
En este ejemplo el investigador A tom la TA a diez personas y registr la
sistlica y diastlica. Obtuvo el promedio. Lo propio hizo el investigador B.
Luego se obtuvo: la desviacin media de la sistlica en el investigador A
(sistlica de la primera persona menos promedio y as sucesivamente). Luego
obtuvo la varianza y con ella obtuvo la Desviacin Estndar. De esa manera obtuvo
todos los elementos para poder comparar a saber:
1. Promedio de A.
2. Promedio de B.
3. Desviacin estndar de A.
1. La comparacin
Poblacin Investigador A Investigador C
Sistolica Diastolica Sistolica Diastolica
1 130 70 150 90
2
3
120
140
80
90
160
140
90
90 Ser que existe diferencia
4
5
125
120
85
80
140
150
90
100 Entre investigador A con C ?
6 140 60 130 100
7 150 80 140 90
8 120 80 130 80
9 130 80 130 80
10 120 70 120 70
Promedios 129,5 77,5 139 88
2. Aplicando la prueba T
Sistolica Diastolica
dm A Varianza dm A Varianza
0,5 0,25 -7,5 56,25
-9,5 90,25 2,5 6,25
10,5 110,25 12,5 156,25
-4,5 20,25 7,5 56,25
-9,5 90,25 2,5 6,25
10,5 110,25 -17,5 306,25
20,5 420,25 2,5 6,25
-9,5 90,25 2,5 6,25
0,5 0,25 2,5 6,25
-9,5 90,25 -7,5 56,25
102,25 66,25
DS A 10,1118742 DS A 8,1394103
Ahora imagine que se trae a un investigador C y surge, por supuesto, la misma pregunta.
Dado que A y B son iguales da lo mismo comparar a C con alguno de ellos dos. Se aplican
todos los pasos para la prueba t y se obtienen los nmeros del crculo. Dado que son
mayores de 6,5 entonces SI EXISTE DIFERENCIA EN LAS CIFRAS OBTENIDAS ENTRE A y
C. Ello es clave porque si no lo hacen de manera similar, no podremos estar seguros que
las diferencias en los resultados sean por la investigacin o por esta diferencia.
REALIDAD
(A es = B) (A es diferente a B)
ENFERMO
SI NO
9
8
7
6
y 5
4
3
2
1
1 2 3 4 5 6 7 8 9 10
x
Resultan muy evidentes las relaciones que existen entre distintas
caractersticas. Por ejemplo, la relacin entre comer y peso, o entre
fumar y cncer del pulmn. Algunas de estas relaciones son tan slidas
que si se incrementa (o se disminuye) una de las caractersticas, se
incrementa (o se disminuye) la otra. En otros casos la relacin es
inversa. Entre ms de esto menos de aquello, pero ciertamente slida ya
que si se afecta una se afecta la otra. Estas relaciones entre variables es
lo que se conoce con el nombre de correlaciones y su estudio es
particularmente importante pues a travs de ello se pueden tomar
decisiones. Por ejemplo, teraputicas que modifican sustancialmente el
pronstico.
talla
armas
peso mortalidad
Tomar
agua
fumar
fiestas Violencia
estudio Equidad
Una frmula para establecerla es: La sumatoria del producto de multiplicar la desviacin
media (DM) de una variable con la desviacin media de la otra variable, y este resultado
dividido por el producto de la raz cuadrada originado con la suma de la desviacin media
de una variable al cuadrado con la de la otra variable al cuadrado.
A manera de ejemplo:
AB= 10
1 1
1=20 AB
AB
= 10 1
1 AB
I=15 1 AB
AB
I 1 AB
I
AB
AB I 1 1
I 1
1 1 1 1 I
I I AB 1
I 1
I I 1 I 1
I I 1
I
I 1
AB 1
Es por ello que los ensayos clnicos o los ensayos de campo, en donde se
selecciona la poblacin de cada grupo (el de intervencin y el de
comparacin) de manera aleatoria, son ideales para hacer inferencias.
La potencia la dar el tamao de la muestra.
MENOS
REPRESENTATIVO
TOTAL DE
POBLACION
MAS
REPRESENTATIVO
A manera de conclusin
Este texto espera haber logrado acercar a la realidad (y a la prctica) los conceptos de
la epidemiologa, la investigacin y la estadstica. Si bien, y para entender, se separan y
se explican dichos conceptos, la realidad es que la forma como se presentan en el mundo
prctico es integral. Muchas definiciones en este texto se han ejemplificado en el
mundo de la medicina, pero igual se podra haber escogido el mundo de la enfermera o
el de cualquier rea de la salud. Ciertamente de lo que se trata es de aplicar una forma
de pensar en donde, y en particular, a travs de las lneas se ha insistido en el mtodo
cientfico.
Esperamos que el texto haya contribuido en el proceso de formacin en que, sin duda,
estn los lectores los invitamos a que nos retroalimenten a travs del correo
[email protected].
Lecturas recomendadas
1. Beaglehole R, Kjellstrom T. Epidemiologa Bsica. Publicacin cientfica 551. OPS
1994.
4. Lapierre D. Ms grandes que el amor. Editorial Planeta Seix Barral Vigsima segunda
edicin. 1999.
7. Falbo GH, Buzzetti R, Cattaneo A. El homicidio entre los nios y adolescentes: estudio
de casos y controles en Recife (Brasil). Bulletin of the World Health Organization.
2001; 79 (1).
11. Lpez MS, Garrido LF. Hernndez AM. Desarrollo histrico de la epidemiologa: su
formacin como disciplina cientfica. Salud pblica de Mxico, 2000; 42(2).
13. Colimon KM. Fundamentos de epidemiologa. Ediciones Daz de Santos SA. 1990.
Madrid (Espaa).
14. Moreno AA, Lpez MS, Corcho BA. Principales medidas en epidemiologa. Salud
pblica de Mxico, 200; 42(4).