Capitulo Muestreos Libro de Notas de Clase
Capitulo Muestreos Libro de Notas de Clase
Capitulo Muestreos Libro de Notas de Clase
EPIDEMIOLOGIA
CAPITULO MUESTREOS EN
EPIDEMIOLOGIA
Partimos por definir como población o universo al recuento total de individuos o personas o
datos en un área delimitada. No siempre población o universo tiene una connotación
demográfica haciendo referencia a personas, puede ser el total de historias clínicas de un
centro asistencial, o la población de caninos que se tiene en un barrio o unidades de
vivienda de un área geográfica o el total de muestras de suero de un banco de sueros de un
laboratorio clínico.
Para que una muestra sea considerada como representativa de la población debe cumplir
con las “características de representatividad”, que son cuatro parámetros: que sea
adecuada, homogénea, no sesgada y suficiente.
La muestra es homogénea cuando incluye absolutamente todas las posibles variaciones que
se encuentran en el universo. Esto quiere decir que si vamos a tomar una muestra
poblacional de una comunidad se debe incluir individuos de los distintos grupos etáreos
existentes, de ambos sexos, incluir los distintos grupos raciales, políticos, religiosos, niveles
de educación, estratos socioeconómicos, ocupaciones laborales, etc.
Para que la muestra sea no sesgada se debe incluir las diferentes variaciones presentes en el
universo en la misma proporción como se encuentran distribuidas. Si la población tiene
mayor peso proporcional de mujeres la muestra debe estar conformada con mayor peso
porcentual femenino y si tan solo el 1% del universo esta constituido por indígenas, la
muestra debe tener también una participación de indígenas en igual proporción.
El término suficiente hace referencia al tamaño que debe tener la muestra, la cual no debe
ser excesivamente grande, pero tampoco puede ser muy pequeña. Debe tener un tamaño
que permita al estudio alcanzar resultados con los grados de confiabilidad y precisión
necesarios.
No existe un único criterio ni fórmula matemática para determinar el tamaño ideal de una
muestra, pues influyen factores como la frecuencia de la variable de estudio y la
homogeneidad de la población. Cuando se desea realizar un estudio de la concentración de
glucosa en la sangre de una persona basta con examinar una gota o máximo unos pocos
mililitros de sangre. En ese mismo sentido podríamos extraer una muestra compuesta por
unos pocos soldados de un batallón para realizar un muestreo de la capacidad pulmonar en
una unidad militar, mientras que si deseamos realizar un estudio de la prevalencia de una
enfermedad sumamente rara (enfermedad de Fabry por ejemplo), tendríamos que realizar
un muestreo casi exhaustivo en la población residente en un país para alcanzar a encontrar
unos pocos casos positivos.
Para efectos prácticos se puede hacer uso de fórmulas matemáticas diseñadas para
determinar el tamaño de una muestra, que involucran el cálculo del error estimado, la
prevalencia o frecuencia de la variable de estudio y el tamaño de la población o universo.
La siguiente es una fórmula para calcular el tamaño de la muestra cuando se tienen
poblaciones infinitas o de difícil estimación.
p q
n= * * t2__
ε2
Donde: n será el tamaño de la muestra
p es la probabilidad de ocurrencia de la variable de estudio (según
estudios previos o estimaciones aproximadas)
q es el complemento de la probabilidad de p
t2 es el valor encontrado en las tablas de distribución t de Student con un
nivel de confianza del 95% y mínimo dos grados de libertad elevado al
cuadrado
ε es el error aleatorio que se estima para el muestreo
Cuando se conoce el tamaño de la población o universo o el tamaño calculado para el
muestreo resulte más grande que la población, se hace necesario aplicar la fórmula de
ajuste siguiente.
n° = n .
1+ n
N
Donde: n° es el tamaño ajustado de la muestra
N es el tamaño del universo o población
Para probar la formula y su utilidad realicemos el siguiente ejercicio: se desea realizar una
investigación para determinar la prevalencia de tendencia suicida entre los habitantes de
una población con 24.000 habitantes con una confianza del 95% y con un error máximo del
5%; por encuestas previas se tiene el antecedente de idea suicida cercano al 8% de la
población. El tamaño de muestra puede ser calculado de la siguiente manera:
n° = 113 _ = 112,47
1 + 113/ 24.000
De las anteriores observaciones podemos deducir que cuando se calcula el tamaño de una
muestra, dicha magnitud depende en gran medida del valor del error que se esta dispuesto a
asumir, constituyéndose en un serio limitante para la viabilidad de un muestreo, pues
conseguir una muestra de 113 individuos parece una tarea fácil, mientras que intentar
completar una muestra de 706 individuos implica un esfuerzo mucho mayor tanto de
logística, como para la digitación de la información como para la recolección de los datos,
aunque los resultados serán mucho más precisos y el intervalo de confianza será más
estrecho; he aquí el dilema que debe asumir el investigador antes de tomar una decisión
apresurada.
El muestreo no aleatorio es aquel que no se realiza con la ayuda del azar y se realiza bajo
criterios definidos por el investigador o se tienen en cuenta intereses particulares del
organizador del muestreo o de los participantes o por facilidad para la conformación de la
muestra. Sus resultados no tienen validez real para ser extrapolados a la población o
universo por no estar cobijados por las reglas del azar.
El muestreo por conveniencia resulta cuando para el investigador es más fácil establecer el
grupo muestral con grupos de personas ya conformados o con individuos que fácilmente
pueden ser localizados en un mismo lugar de congregación o cuya localización es fácil para
el realizador del muestreo o para no recorrer grandes distancias si la muestra esta muy
dispersa geográficamente y se tiende a concentrarla en un área más estrecha.
Si el interés del muestreo es poder realizar un estudio con validez de sus resultados y
fiabilidad se debe evitar utilizar estas técnicas de muestreo pues sus resultados no pueden
ser manipulados estadísticamente ni se pueden hacer inferencias en la población general.
Consiste en realizar un listado con los nombres de todos y cada uno de las personas o
individuos que forman parte de la población asignándoles un número en orden ascendente a
partir de uno (1) hasta que se complete la asignación de números de acuerdo con la cantidad
de individuos. En una bolsa de color opaco se introducen papelitos con todos los números
asignados y tras agitarlos y revolverlos vigorosamente para asegurarse de que quedan bien
mezclados, se procede a ir sacando papeletas y se va anotando que número fue
seleccionado para hacer parte de la muestra. Se debe sacar el número de papeletas hasta que
se complete el tamaño de la muestra. Puede hacerse mediante dos técnicas: extracción sin
reposición o extracción con reposición; la primera consiste en ir sacando papeletas, anotar
el número, desecharla y extraer una nueva, de manera que se asegure que ningún número
quedo repetido. Tiene la desventaja de que con cada nueva extracción aumenta la
probabilidad de ser seleccionado como parte de la muestra y por tanto no se cumple al pie
de la letra con la regla de que cada uno de los integrantes del universo tenga la misma
probabilidad de ser seleccionado para hacer parte e la muestra.
La extracción con reposición consiste en que cada papeleta con un número extraído luego
de ser leída se vuelve a introducir en la bolsa para que cada extracción otorgue exactamente
la misma probabilidad de ser seleccionado a todos y cada uno de los números del universo.
Obviamente hay la probabilidad de que un número pueda ser extraído más de una vez y
quede repetido, sin embargo en este caso se debe proceder a sacar otro número como
reemplazo.
Este método trae a nuestra memoria recuerdos asociados a las rifas que se hacían en la
escuela o en los bazares y aunque parece tratarse de un método muy poco ortodoxo por su
sencillez, resulta ser uno de los métodos más prácticos y que mejor asegura que la muestra
sea extraída totalmente al azar, sin embargo reviste cierto grado de dificultad cuando el
tamaño del universo o el de la muestra es muy grande haciendo dispendioso el
procedimiento, en este caso se recomienda utilizar otro de los métodos de muestreo que se
verán más adelante.
Existe más de una tabla con números del 0 al 9 escogidos aleatoriamente y dispuestos de
forma ordenada en filas y columnas. Para efectos de explicar este método se ha tomado la
tabla con más de mil dígitos escogidos al azar diseñada por Donald B. Owen (ver tabla 1).
Tabla 5. Tabla de números aleatorios
3690 2492 7171 7720 6509 7549 2330 5733 4730 2963 8167 6712 9820 0813 6790 6858
1489 2669 3743 1901 4971 8280 2086 5457 7703 2758 6477 5289 4092 4223 6454 7632
7577 2816 9002 6381 4247 4652 2953 0772 2160 7236 0812 4195 5589 0830 8261 9232
3167 8552 5409 1556 5692 9870 3583 8997 1533 6466 8830 7271 3809 5505 8474 8472
2266 2080 3828 7880 0586 8482 7811 6807 3309 2729 9562 3252 9848 6030 1039 3382
7600 1077 4455 8806 1822 1669 7501 3339 2854 9691 7478 7227 0104 4141 1521 9104
5563 1392 8238 4882 5411 2647 7242 2800 8506 6348 4612 8252 1062 1757 0964 2983
2244 7569 7551 3380 2152 5086 0303 7423 3298 3979 2831 2257 1508 7642 3389 5678
2589 0288 0092 1629 0377 3590 2209 4839 6332 1490 3092 9396 3464 1702 9204 0935
5565 2315 8030 7651 5189 0075 9353 1921 1263 7017 8057 5573 2605 3973 8204 4143
2677 0034 8601 3340 8383 6612 0721 3899 2999 7277 9889 0390 5579 4620 5650 0210
2082 4664 0578 0097 3521 8772 5484 3900 3485 0741 9069 5920 4326 7704 6525 4859
2660 7852 9096 6905 7127 5933 1137 7583 6450 5658 7678 3444 4014 3543 6130 4247
8387 5323 3753 1859 6043 0294 5110 6340 9137 2897 0262 5092 5541 4094 4957 0163
9717 4118 4276 9465 8820 4127 4675 1435 2192 0874 4951 3781 5101 1815 7068 6379
7252 1086 8919 9047 0199 5068 7447 1664 9278 1708 3625 2864 7274 9512 0074 6677
8676 0222 3335 1976 1645 9192 4011 0255 5458 6942 8043 6201 1587 0972 0554 1690
6333 1931 9433 2661 8690 2313 6999 9231 5627 1815 7171 8036 1832 2031 6298 6073
3995 9677 7765 3194 3222 4191 2734 4469 8617 2402 6250 9362 7373 4757 1716 1942
0417 5921 5295 7385 5474 2123 7035 9983 5192 1840 6176 5177 1191 2106 3351 5057
0967 4538 1246 3374 7315 3365 7203 1231 0546 6612 1038 1425 2709 5775 7517 8974
3961 2183 5295 3096 8536 9442 5500 2276 6307 2346 1285 7000 5306 0414 3383 3251
8902 8843 2112 8567 8131 8116 5270 5994
Fuente: Owen, Donald B. Handbook of Statistical Tables, Reading Mass: Addisson-Wesley, 1.962
El método consiste en determinar el tamaño del muestreo y dependiendo del tamaño del
universo, si el número máximo consta de dos o tres dígitos, se procede a buscar números
con esa misma cantidad de dígitos, que se encuentren dentro del rango del universo. Se
selecciona el primer número a partir de la fila y columna que desee el investigador, dado
que los números no tienen una distribución lógica y ordenada. Una vez definida la fila y la
columna a partir de la cual se va a realizar la pesquisa y sabiendo el número de dígitos que
debe tener el número se empieza a leer la serie de números que van apareciendo de ahí
hacia abajo o hacia la izquierda o derecha o hacia arriba y cada vez que un número caiga
dentro del rango de valores asignados para el muestreo, este número se ira anotando dentro
del grupo de números que hacen parte de la muestra. Así se ira avanzando hasta terminar en
la última fila y se podrá iniciar nuevamente en otra fila y columna sucesivamente hasta
completar el tamaño del muestreo. Debe descartarse cualquier número que salga repetido,
razón por la cual es necesario revisar cuidadosamente que ningún número se halle más de
una vez dentro del grupo muestral.
Muestreo sistemático
Este método permite seleccionar muestras en poblaciones muy grandes de forma ágil y en
ocasiones aprovechando los recursos informáticos, lo que lo hace uno de los métodos más
utilizados por su versatilidad, practicidad y efectividad, además de prestarse para realizar
muestreos en poblaciones muy grandes.
Se ordenan los elementos del universo en orden ascendente y decidido el tamaño de la
muestra, se calcula el intervalo de muestreo (I) al dividir el universo (N) por el tamaño de la
muestra (n).
I = ___N____
n
El primer elemento del universo se selecciona totalmente al azar y los subsiguientes se irán
obteniendo al ir agregando sistemáticamente el valor del intervalo hasta completar el
tamaño del muestreo. Es importante tener en cuenta que si al llegar al final de la lista y aún
no se ha cumplido con el tamaño de muestreo necesario, se debe continuar con los números
del principio ubicados antes del primer seleccionado. Para efectos de comprenderlo
plenamente se propone el siguiente ejemplo: se desea eximir del examen final de un curso
al 10% de los estudiantes de un grupo de matemáticas que cuenta con 32 alumnos, es decir
que se seleccionara una muestra de 3 estudiantes de forma sistemática. El intervalo de
muestreo es de 10 (resultado de la operación 32 ÷ 3) y al buscar un número utilizando el
método de los números aleatorios en el rango entre 1 y 32, el primer seleccionado fue el 18
y al sumar sistemáticamente el intervalo el siguiente número es el 28 y el último es el 6,
dado que tan solo quedaban cuatro números hasta 32 y se continuo el conteo desde el inicio
hasta llegar a completar el intervalo.
Muestreo estratificado
Ejemplificamos este tipo de muestreo de la siguiente manera: contamos con los 2543
pacientes de un hospital y se desea realizar una encuesta de satisfacción con el servicio a
una muestra del 12%, es decir 305 pacientes de todos los servicios. Al estratificar a los
2543 pacientes por servicio encontramos que 300 hacen parte del servicio de cancerología,
52 de cuidados intensivos, 168 de ortopedia y traumatología, 286 de pediatría, 118 de
hospitalización, 298 de riesgo cardiovascular, 46 de la unidad renal, 125 de ginecología y
obstetricia y 1165 de consulta externa y se desea que la muestra sea equitativa en cada uno
de los servicios del hospital, a continuación se presenta la nueva distribución de la muestra:
Nótese que la muestra se redujo en dos unidades al perderse los decimales sobrantes al
realizar la estratificación, sin embargo la muestra quedo equitativamente distribuida en cada
uno de los servicios, acorde con el peso de cada uno dentro del universo.
Este método es útil cuando las investigaciones abarcan extensas zonas geográficas donde
una división administrativa puede ser un conglomerado, como por ejemplo barrios de una
ciudad, distritos, cabeceras municipales, municipios, veredas, etc. Es más fácil si las
personas a muestrear viven agrupadas en un área delimitada que si viven dispersas por toda
una región o país.
Podríamos citar como ejemplo que si deseamos aplicar una encuesta de hábitos de aseo a
una muestra de 250 viviendas (10%) de las 2504 que integran el barrio San Blas en Bogotá,
es más fácil dividir el barrio en conglomerados, donde cada manzana corresponde a un
conglomerado, y distinguimos manzanas con hasta 60 viviendas y manzanas con tan solo 5
unidades residenciales, es decir que no son homogéneas. De los 64 conglomerados
identificados, seleccionamos al azar un número más reducido de manzanas para distribuir
más fácilmente la muestra en los conglomerados seleccionados, cuyo número puede variar
de acuerdo con los criterios del investigador y la disponibilidad de tiempo, recurso humano
y facilidad de acceso. De esta manera ya no es necesario realizar un cubrimiento de la
totalidad de las 64 manzanas, sino que los esfuerzos se concentran en un número menor de
ellas, donde se distribuye el tamaño muestral.
El primer paso es definir claramente los objetivos identificando el campo de estudio, las
características de las muestras y los datos a obtener.
Se desea realizar un sondeo entre los estudiantes que han cursado la asignatura de
EPIDEMIOLOGIA durante los dos últimos años, con el fin de evaluar el grado de
entendimiento y utilidad práctica en su formación profesional del software EPI-INFO
2002. Se ha elaborado un listado con los 129 alumnos que han cursado la asignatura en este
lapso de tiempo y se han ordenado por código. Se desea aplicar un formato de evaluación al
30% de ellos de forma aleatoria.
No CODIGO NOMBRE
No CODIGO NOMBRE
1 9928520ALEXANDER CELY 66 20042085024JUAN ALEJANDRO MORENO
2 20021085024Luis Carlos Cifuentes 67 20042085025OSCAR JAVIER OBANDO
3 20022085038RAUL GUILLERMOLUNA 68 20042085026LADY CATHERINE PARRA
4 20022085073ALEXANDER SAGANOME 69 20042085027Sonia Patricia Perez
5 20022085087DIANA MARITZA TIRADO 70 20042085028MARIA ISNEDI PINILLA
6 20031085042LESLI ANNETH MENDOZA 71 20042085030DIANA SAYURI RODRIGUEZ
7 20031085061ALEJANDRO RODRIGUEZ 72 20042085032MARTHA JANETH ROZO
8 20031085063NEIDY JOHANA RODRIGUEZ 73 20042085033JOHANNA RUBIANO
9 20031085077David Alejandro Teuta 74 20042085034LIDIA ALEJANDRA SANABRIA
10 20031085083MILTON GABRIEL VARGAS 75 20042085037 IVONNE DAYANA VARGAS
11 20032085005LADY ARTEAGA 76 20042085038HERMES JAVIER VILLAMIL
12 20032085009WILLIAM EDUARDO CALDAS 77 20051085001LUISA FERNANDA ALDANA
13 20032085021SANDRA PATRICIA DUQUE 78 20051085004JENNY PATRICIA BELTRAN
14 20032085034EMILSE HERNANDEZ 79 20051085005Rodrigo Borda
15 20032085047GUILLERMO ORTIZ 80 20051085006NATHALY BUITRAGO
16 20032085052JOSE MAURICIO PEÑALOZA 81 20051085010DIEGO CLAVIJO
17 20032085053CARLOS ANDRES PINILLA 82 20051085011ADRIANA CORRALES
18 20032085058LUISA FERNANDA REYES 83 20051085014ADRIANA ESCAMILLA
19 20032085070JULIAN EDUARDO ROJAS 84 20051085016Jeison Garcia
20 20032085071JUAN CAMILO ROMERO 85 20051085017FREDY GOMEZ
21 20032085072Henry Rosas 86 20051085021FRANCY MILENA LINARES
22 20032085078ANA PAOLA VANEGAS 87 20051085026ANGIE NATHALY MARTINEZ
23 20041085002CRISTIAN ANDRES ACOSTA 88 20051085028ERIKA MONCADA
24 20041085007ALFONSO BEJARANO 89 20051085029SANDRA JOHANA MORALES
25 20041085012CESAR GIOVANI CASTILLO 90 20051085032CARLOS IVAN ORTEGON
26 20041085015Oscar Javier Cespedes 91 20051085033CAROLINA OTALORA
27 20041085016RODRIGO ALFREDO COBOS 92 20051085034YASMIN PABON PEÑA
28 20041085020JAIME ALFONSO CHAPARRO 93 20051085035RICARDO PAEZ
29 20041085021 ANGELA MARIA DAZA 94 20051085036ALEJANDRO PERALTA
30 20041085025 JENNI JOHANA ESTRADA 95 20051085039JULIO CESAR QUINTERO
31 20041085026LEIDY DIANA FLÓREZ 96 20051085040CAROLINA QUINTERO
32 20041085027HECTOR HERNANDO FLORES 97 20051085046MILLER GERMAN RODRIGUEZ
33 20041085030MARCELA GARZON BONILLA 98 20051085049NANCY JOHANNA ROJAS
34 20041085031PEDRO GODOY DIAZ 99 20051085050SINDY CATALINA RUGELES
35 20041085035MARLEN GUTIERREZ 100 20051085053MARIA ESNEYDER SALAZAR
36 20041085036BEATRIZ EUGENIA GUTIERREZ 101 20051085054GUILLERMO SANCHEZ
37 20041085038 EDWIN ANDRES HERNANDEZ 102 20051085055ANA MARIA SANCHEZ
38 20041085040ANGELA PAOLA JIMENEZ 103 20051085056TATIANA SIERRA
39 20041085043Roy Arcenio Maya 104 20051085057JAIRO ESTEBAN VARGAS
40 20041085044Diego Fernando Medina 105 20051085059SAMUEL ESTEBAN ZAMORA
41 20041085048Jenny Paola Molina 106 20051085061GABRIEL ENRIQUE MOYANO
42 20041085051LUZ MARCELA MOYA 107 20051085063KAREN ANDREA ACOSTA
43 20041085056ANDREA PACHON RUIZ 108 20052085002Jacqueline Aranguren
44 20041085057 JOHN FREDDY PAEZ 109 20052085003Adriana Arevalo
45 20041085058PAOLA ALEXANDRA PARDO 110 20052085006Johanna Bejarano
46 20041085063CESAR ENRIQUE RAMIREZ 111 20052085011Angie Paola Castillo
47 20041085069JOSÉ IGNACIO RODRIGUEZ 112 20052085018Luis Fernando Giron
48 20041085071MONICA YAMILE ROMERO 113 20052085020Sindy Lorena Gonzalez
49 20041085076JHON EDISON VARGAS 114 20052085021Vivian Julieth Gonzalez
50 20042085002FABIAN RICARDO ARCE 115 20052085023Leidy Hernandez
51 20042085003ANGELICA MARIA BRICEÑO 116 20052085025Nataly Jacome
52 20042085004JESUS ANTONIO BUITRAGO 117 20052085031Diego Andres Mendez
53 20042085005ROSA LILIANA BUITRAGO 118 20052085032Nancy Misnasa
54 20042085006JUAN CARLOS CARDENAS 119 20052085034Alix Monsalve
55 20042085007ALEXANDRA CASALLAS 120 20052085035Diana Catalina Mora
56 20042085008HOOVER CEREZO TOVAR 121 20052085040Oscar Daniel Perez
57 20042085011 LINA MARCELA FONSECA 122 20052085045Yamile Rincon
58 20042085012Maryoli Garcia 123 20052085048Diana Carolina Roa
59 20042085014JOSE ALEJANDRO HINCAPIE 124 20052085052Leidy Caterine Sanchez
60 20042085015WILDER ENRIQUE IMBOL 125 20052085054Edwin Julian Silva
61 20042085019Wilson Orlando Medina 126 20052085055Jefferson Velandia
62 20042085020MAGALY MERCHAN 127 20052085056Natalia Velasquez
63 20042085021ARNALDO DE JESUS MEZA 128 20052085061Neomar Alonso Bustos
64 20042085022Yanira Millan 129 20061085001 Nathaly Aguilar
65 20042085023JOHANA ESPERANZA MOLANO
a.) Cuantos estudiantes hacen parte de la población o universo para este estudio?
b.) Cuantos estudiantes harán parte de la muestra?
c.) Utilizando el método aleatorio sistemático determine la muestra señalando:
El intervalo
El nombre del primer seleccionado y que criterio tuvo en cuenta para escogerlo
El número de los siguientes seleccionados hasta completar la muestra
e.) Utilice el método de la lotería para seleccionar la muestra (con extracción sin
reposición) y señale:
f.) Realice una estratificación del universo según el año en que cursaron la asignatura y
por la variable sexo (Los que cursaron en el 2007 están en minúsculas, los del 2006 en
MAYUSCULAS) y de acuerdo con la estratificación determine: