2 Curso de Bioestadistica para Enfermería
2 Curso de Bioestadistica para Enfermería
2 Curso de Bioestadistica para Enfermería
2
, para este ejemplo, vendra dado entonces como:
A la vista de este resultado, lo que tenemos que hacer ahora es plantear un contraste de
hiptesis entre la hiptesis nula:
H
0
: No hay asociacin entre las variables el bajo peso del nio y el hecho de fumar
durante la gestacin son independientes, no estn asociados.
Y la hiptesis alternativa:
H
1
: s hay asociacin entre las variables el bajo peso y fumar durante la gestacin
estn asociados.
El siguiente paso sera calcular los grados de libertad. Para el caso de una tabla de
contingencia de r filas y k columnas, los g.l. son igual al producto del nmero de filas menos 1 (r
1) por el nmero de columnas menos 1(k 1). As, para aquellos casos en que se estudie la
relacin entre variables dicotmicas (tabla 2x2) los g.l. son 1.
De ser cierta la hiptesis nula, el valor obtenido debera estar dentro del rango de mayor
probabilidad segn la distribucin chi- cuadrado correspondiente. El valor d que, como ya se ha
mencionado anteriormente, suele adquirir un valor de p < 0,05, no es ms que la probabilidad de
obtener los datos observados si fuese cierta la hiptesis de independencia. En el Anexo 3 se
determinan los grados de libertad (en la primera columna) y el valor de d (en la primera fila). El
nmero que determina su interseccin es el valor crtico correspondiente. De este modo, si el
estadstico
2
que se obtiene toma un valor mayor se dir que la diferencia es significativa. As,
para una seguridad del 95 % (d = 0,05) el valor terico de una distribucin chi- cuadrado con un
grado de libertad es 3,84. Para d = 0,01 es de 6,63 y para d = 0,005 es de 7,88. Como quiera que
en el calculo del
2
del ejemplo obtuvimos un valor de 40,04, que supera al valor para d = 0,005,
podremos concluir que las dos variantes no son independientes, sino que estn asociadas (p<
0,005). Por lo tanto, a la vista de los resultados, rechazamos la hiptesis nula (H
0
) y aceptamos la
hiptesis alternativa (H
1
) como probablemente cierta.
5.3.2.Relacin entre una variable cualitativa y otra cuantitativa: prueba t de Student y anlisis de
la varianza.
31
Existen dos posibles casos a la hora de analizar la relacin entre una variable cualitativa
y otra cuantitativa.
a.Comparar una variable cuantitativa con otra cualitativa de dos categoras. Para
realizar la comparacin de 2 medias, la prueba ideal es la t de Student, que se usa para
comprar los datos de dos distribuciones y comprobar si son homogneas o diferentes
(proceden las dos muestras de poblaciones iguales o diferentes).
Datos independientes: si la medicin de las caractersticas se hace en
individuos diferentes. Por ejemplo, comprobar si la Tensin arterial es
igual en hombres y en mujeres. La Tensin arterial sera la variable
cuantitativa, mientras que el sexo (hombre y mujer), corresponde a la
variable cualitativa.
Datos apareados: si la medicin de las caractersticas se hace en los
mismos individuos, en distintas condiciones de medicin. Por ejemplo,
comprobar si es igual la Tensin Arterial en los mismos individuos, antes
y despus de realizar ejercicio fsico. En este caso se evala un mismo
dato, la tensin arterial, ms de una vez en cada sujeto de la muestra,
esto es, antes y despus del ejercicio fsico. En este tipo de anlisis el
inters no se centra en la variabilidad que puede haber entre los
individuos, sino en las diferencias que se observan en un mismo sujeto
entre un momento y otro.
Si el valor hallado por frmula es mayor que el valor tabulado, se acepta
la hiptesis alternativa (las muestras proceden de poblaciones diferentes,
con una probabilidad de equivocarnos igual al valor de p). Si el valor de
la frmula (t) es menor que el tabulado, no podemos rechazar y, por
tanto, nos quedamos con la hiptesis nula (las muestras proceden de
poblaciones iguales o no podemos afirmar que las poblaciones sean
diferentes).
En caso de no poder aplicar esta prueba, se usar la prueba no
paramtrica U de Mann-Whitney, si los datos son independientes, y el
test de Wicolxon, si son apareados.
b. Para relacionar una variable cuantitativa con otra cualitativa de ms de dos
categoras. En este caso el mtodo utilizado es el anlisis de la varianza. El Anlisis de la
Varianza ( o ANOVA: Analysis of variance) es un mtodo necesario porque cuando se
quiere comparar ms de dos medias es incorrecto utilizar el mtodo anterior, t de
Student, por dos causas fundamentales:
Primero: al realizarse simultnea e independientemente varios
contrastes de hiptesis, la probabilidad de encontrar alguno significativo
por azar aumentara.
Segundo: en cada comparacin la hiptesis nula es que las dos
muestras provienen de la misma poblacin, por lo tanto, cuando se
hayan realizado todas las comparaciones, la hiptesis nula es que todas
las muestras provienen de la misma poblacin y, sin embargo, para cada
comparacin, la estimacin de la varianza necesaria para el contraste es
distinta, pues se ha hecho en base a muestras distintas.
El mtodo que resuelve ambos problemas es el anlisis de la varianza, aunque
es algo ms que esto: es un mtodo que permite comparar varias medias en diversas
situaciones; muy ligado, por tanto, al diseo de experimentos, y de alguna manera, es la
base del anlisis multivariante.
Un ejemplo simple de utilizacin del mtodo ANOVA podra ser el siguiente: qu
efecto produce el ruido sobre un grupo de sujetos en su nivel de estrs. Para ello, el
32
grupo 1, no recibe ningn estimulo auditivo; el grupo 2, recibe cierta cantidad de ruido y,
el grupo tres el doble de ruido que el anterior. De esta forma tenemos una variable
cualitativa ruido con tres categoras (nulo, moderado e intenso) y, una variable
cuantitativa, puntuacin de estrs.
En caso de no poder aplicar esta prueba se utilizar la prueba no paramtrica de
Kruskal-Wallis.
5.3.3.Relacin entre dos variables cuantitativas: correlacin y regresin.
Existen varios ndices para medir la correlacin entre variables cuantitativas. Vamos a
ver el ndice de correlacin de Pearson, aunque hay que tener en cuenta que es un ndice que
slo puede aplicarse a variables medidas en escalas de intervalo, ya que esta escala es la nica
en que se pueden obtener puntuaciones tpicas.
El coeficiente de correlacin de Pearson, se valora con el ndice r de Pearson cuyos
valores oscilan entre -1 y +1, y mide el grado de asociacin lineal. Este coeficiente se define
como la media de la suma de los productos cruzados de las puntaciones tpicas de dos series de
puntuaciones:
Es decir, el coeficiente de correlacin es un ndice del grado de relacin entre dos
variables que no est expresado en las unidades de ninguna de las variables y, por tanto, un
ndice que permitir comparaciones entre diferentes conjuntos de variables cuantitativas. Estas
variables tienen un papel simtrico no pudindose diferenciar entre variable independiente y
variable dependiente.
Las puntuaciones obtenidas se interpretan de la siguiente manera:
-1: correlacin perfecta negativa; cuando disminuye una de las variables, aumenta la
otra.
0: correlacin nula, no existe asociacin lineal entre las dos variables.
+1: correlacin positiva perfecta; cuando aumenta una de las variables, aumenta la otra.
Grfico 13.
La relacin entre dos variables cuantitativas correlacionadas, pudiendo predecir una variable
(variable dependiente x) conociendo la otra (variable independiente y), se puede describir con
la ecuacin de Regresin o recta de Regresin (la ecuacin representa a una recta):
33
y = a + bx
y = valor de la variable cuantitativa que podemos predecir.
x = valor de la variable que conocemos.
a = lugar donde la recta corta al eje de coordenadas (ordenada en el origen)
b = unidades que cambia la variable y al aumentar una unidad la variable x (pendiente).
Grafico 14.Recta de regresin.
La ecuacin nos va a permitir conocer el valor de la variable y en funcin de la variable x.
Pero para entender la relacin entre el coeficiente de correlacin de Pearson y la recta
de regresin hemos de hablar de la Covarianza, ndice que nos proporciona caractersticas
interesantes de la asociacin entre dos variables y que puede hacer ms comprensible el ndice
de correlacin. La covarianza es el producto-momento de las puntuaciones de desviacin x e y,
es decir, es la media de la suma de las puntuaciones de desviacin. Se simboliza por V
xy
y puede
ser positiva, negativa o 0.
Nos indica la variabilidad entre dos conjuntos de puntuaciones. Por otro lado, tambin
sirve como criterio para deducir el coeficiente b de la pendiente.
De esta forma, la relacin entre la fuerza de asociacin de 2 variables y la prediccin de
una a partir de la otra, esto es, entre r y b:
34
Tabla 8. Pruebas bivariantes de significacin estadstica
6.Muestreo .
Muestreo probabilstico: Los muestreos probabilsticos son aquellos en los
que se utiliza algn sistema de seleccin aleatoria para garantizar que cada unidad de la
poblacin tenga una probabilidad especfica de ser seleccionada, cumplindose de esta manera
dos requisitos:
Toda unidad tiene una probabilidad de ser elegida.
Esa probabilidad es conocida de antemano.
Es decir, cuando puede calcularse de antemano la probabilidad de obtener cada una de
las muestras que sea posible seleccionar; para lo cual es necesario que la seleccin de la
muestra pueda considerarse como un experimento aleatorio. Es el nico tipo de muestreo que
puede darnos el riesgo que cometemos con la inferencia.
Muestreo no probabilstico: las muestras se seleccionan mediante mtodos
en los que no interviene el azar, de modo que no se puede estimar la probabilidad que tiene cada
elemento de ser incluido en la muestra y no todos los elementos tienen posibilidad de ser
incluidos.
6.1.Tcnicas de muestro probabilstico.
6.1.1.Muestreo irrestrictamente aleatorio o muestreo aleatorio simple.
Es el mtodo ms sencillo de muestreo y la base para el resto de mtodos aleatorios. Se
llama irrestrictamente aleatorio porque es sin reposicin. Consiste en tomar de una poblacin de
tamao N, una muestra de tamao n, de forma aleatoria y sin reposicin, con lo que las nuestras
posibles son:
35
Para llevar a cabo un muestreo de este tipo debemos:
Disponer de una lista con todos los elementos de la poblacin y a continuacin
numerarlos consecutivamente.
Bien con una tabla de nmeros aleatorios, bien con programas informticos,
obtendremos aleatoriamente los n nmeros que componen nuestra muestra en funcin
del tamao deseado.
Del listado previo, donde tenemos numerados cada uno de los elementos de la
poblacin, tomaremos cada uno de los n elementos que se correspondan con los
nmeros obtenidos de forma aleatoria y sern stos los que formen nuestra muestra.
Este mtodo de muestreo es equiprobabilstico, ya que todos los elementos tienen las
mismas posibilidades de ser elegidos, esa probabilidad es conocida a priori y adems es la
misma para todos los elementos:
No obstante, existen una serie de desventajas que hacen que habitualmente se recurra a otros
tipos de muestreo que lo simplifiquen y lo hagan asequible. stas son:
o Es necesario contar con una lista numerada de todos los elementos de la
poblacin.
o Los elementos seleccionados pueden estar muy dispersos, por lo que contactar
con cada uno de ellos puede resultar costoso tanto en tiempo como en dinero.
o Determinados subgrupos de la poblacin, sobre todo aquellos de carcter
ms minoritario, pueden tener escasa o nula representacin en la muestra, sobre
todo si sta es pequea.
6.1.2.Muestreo sistemtico.
Consiste en seleccionar a los individuos segn una regla o proceso peridico. En primer
lugar debe calcularse k (constante de muestreo), siendo k un nmero entero resultado de dividir
el tamao de la poblacin entre el tamao de la muestra:
Si el resultado fuese un decimal, habra que redondear al entero ms prximo. La
primera unidad i ha de ser un nmero comprendido entre 1 y k, es decir: 1> i > k. Los elementos
que integran la muestra son los que ocupan en la poblacin los lugares: i, i + k, i + 2k, ..,i +(n-
1)k.
Por ejemplo, partiendo de una poblacin formada por 100 elementos, N= 100, de la que
escogemos una muestra de 25, n = 25, por medio de muestreo aleatorio sistemtico.
K=100/25=4
El arranque aleatorio i ha de ser un nmero entre 1 y 4. Tomamos la tabla de los
nmeros aleatorios y obtenemos el 2, i = 2. De esta forma, la poblacin estar formada por los
elementos que ocupan en la poblacin los lugares: 2, 6, 10, 14, ..., 98.
Este tipo de muestreo no es aconsejable en las situaciones en que las unidades de
muestreo estn ordenadas por algn criterio peridico y la constante de muestreo puede coincidir
con ello, ya que entonces la muestra puede no ser representativa. En el ejemplo anterior, si la
poblacin que queremos estudiar estuviera formada por familias de cuatro sujetos, padre, madre,
hermano mayor, hermano menor, ordenados siempre as. Sea cual sea el arranque aleatorio que
36
se obtenga, la muestra slo estar formada por un tipo de sujetos, o los padres, o las madres, o
los hermanos mayores o los menores, con lo que la muestra no sera representativa de la
poblacin sino slo de ciertos elementos de ella.
6.1.3. Muestreo estratificado.
Si se sabe que una poblacin puede dividirse en partes o estratos, de forma que en cada
uno de ellos los elementos posean una gran homogeneidad con respecto al carcter que se
estudia, entonces se aumenta la precisin de las estimaciones tomando una muestra en cada
estrato, es decir, actuando separadamente en cada estrato.
Los estratos hay que hacerlos en funcin de las categoras de las variables por las que
se quiere estratificar, que son las variables que pueden influir en los resultados.
Dentro de cada estrato se puede aplicar el muestreo aleatorio simple o el muestreo
aleatorio sistemtico. En ambos casos la seleccin es aleatoria y se tiene el muestreo aleatorio
estratificado. Por ejemplo, en una poblacin de estudiantes universitarios, queremos conocer el
hbito tabquico. Dividiremos por tanto la poblacin en estratos: las distintas carreras
universitarias y haremos un muestreo aleatorio en cada una de ellas, con lo que tendremos
asegurado que todos los estratos son estudiados, mientras que con el muestreo aleatorio simple
o con el sistemtico, algunas de las carreras podran aparecer ms representadas que otras.
Por la forma de obtener el tamao de la muestra podemos distinguir:
Muestreo estratificado con afijacin proporcional: cuando las varianzas en los
estratos no difieren mucho entre s. El tamao de la muestra se toma
proporcionalmente al tamao del estrato. La proporcin de sujetos en la muestra
es similar a lo que ocurre en la poblacin.
Muestreo estratificado con afijacin no proporcional: cuando las varianzas de los
estratos difieren mucho entre s. En tal caso puede tomarse en consideracin tal
varianza, y as en los estratos en que sta sea grande, se tomar una muestra
de mayor tamao relativo para aumentar la precisin. En este caso la proporcin
de individuos con un determinado atributo en la muestra es mayor que lo que
ocurre en la poblacin. A la hora de inferir los resultados a la poblacin tenemos
que ponderar, es decir, otorgarle un peso a cada muestra en funcin de su
proporcin en la poblacin.
Hacer el muestreo proporcional o no proporcional depende ms bien del tamao del
estrato, y consecuentemente, de la muestra. Se utiliza para asegurar que cada uno de los
estratos tiene una muestra suficiente para obtener estimaciones precisas.
6.1.4. Muestreo por conglomerados.
Hasta ahora, los mtodos estudiados, estn diseados para seleccionar a los elementos
de la poblacin directamente, es decir, que las unidades mustrales son elementos de la
poblacin. En el muestreo por conglomerados en cambio, la unidad muestral es un grupo de
elementos de la poblacin, a la que denominamos conglomerados.
Por norma general, estos grupos o conglomerados existen realmente, as, por ejemplo,
las personas se agrupan en familias, las familias viven en casas, las casas se agrupan en
barrios, los barrios en municipios, etc. De esta forma, cualquiera de estos conglomerados puede
utilizarse como unidad de muestreo.
En el muestreo por conglomerados seleccionaremos aleatoriamente un determinado
nmero de conglomerados e investigaremos posteriormente todos los elementos pertenecientes
a ellos. Por ejemplo, si queremos conocer el grado de satisfaccin de los usuarios de Atencin
37
Primaria de la Comunidad de Madrid, podemos seleccionar como unidad de muestreo las
diferentes reas de Salud existentes y elegiremos aleatoriamente 3, el rea 1, el rea 4 y el rea
11 y de aqu tomaremos a todos los usuarios de Atencin Primaria.
Los conglomerados suelen ser frecuentemente reas geogrficas, por ello, el
denominado muestreo por reas no es ms que un caso particular del muestro por
conglomerados.
La ventaja que presenta el muestreo por conglomerados es que no es necesario conocer
todos los elementos de la poblacin para seleccionarlos de manera aleatoria, sino que una vez
dividida la poblacin y determinados los conglomerados, y seleccionados un determinado nmero
de ellos, slo tenemos que conocer a los sujetos pertenecientes a los conglomerados
seleccionados, sin importarnos el resto.
6.1.5.Muestreo por etapas.
Es una generalizacin del muestreo por conglomerados. En la primera etapa
seleccionaremos conglomerados de una clase, las denominadas unidades mustrales primarias,
por ejemplo, siguiendo con el ejemplo anterior, las reas de Salud; en la segunda etapa
seleccionaremos conglomerados ms pequeos, pertenecientes a los anteriores, esto es,
unidades mustrales secundarias, en nuestro ejemplo, para simplificar ya que las reas tienen
una extensin demasiado amplia, podramos reducir y seleccionar segn los distintos centros de
salud pertenecientes a cada rea. Y as sucesivamente, tantas etapas como considerramos
necesario. De esta manera, tan solo se necesita el listado de los elementos sobre los cuales se
ha de aplicar la ltima etapa.El muestreo por etapas, o polietpico, tiene como ventaja aadida
que se puede aplicar el muestreo aleatorio (simple, sistemtico o estratificado) que el
investigador considere ms adecuado al tipo de conglomerados con los que est trabajando.
6.2.Tcnicas de muestreo no probabilstico.
6.2.1. Muestreo consecutivo.
Es el muestreo no probabilstico ms utilizado. Si se lleva a cabo de manera adecuada,
podemos obtener una representatividad de la muestra semejante a la obtenida con un muestreo
probabilstico. Este tipo de muestreo consiste en reclutar a todos los elementos de la poblacin
accesible que cumplan con los criterios de inclusin establecidos durante el perodo de
reclutamiento fijado para el estudio. Este perodo depender del tamao muestral deseado y del
nmero de elementos que podemos captar cada da. Por ejemplo, si deseamos saber los hbitos
de higiene dental de los nios de 4 a 8 aos, podemos realizar un muestreo consecutivo entre
todos los nios comprendidos entre estas edades que acudan a nuestro centro de salud durante
un ao.
6.2.2. Muestreo de conveniencia .
El muestreo de conveniencia o accidental, utiliza una determinada muestra porque es
aquella que tenemos accesible, a veces incluso, pueden ser voluntarios.
Situarnos en una determinada calle y realizar una encuesta sobre x tema a todos
aquellos individuos que pasen por la calle y accedan a respondernos, sera un muestreo de
conveniencia. Muchos estudios clnicos tambin lo son.
Es una de las tcnicas menos slidas, pero en cambio de las ms utilizadas. Tiene un
gran riesgo de sesgos.
38
6.2.3. Muestreo a criterio.
El muestreo a criterio o intencional, es aquel donde el propio investigador selecciona a
los individuos que considera ms apropiados.
Es muy utilizado cuando se desea tomar una muestra de expertos. Por ejemplo, a la hora
de conocer el grado de conocimientos en cuanto a gestin de la calidad dentro de la Enfermera.
Para seleccionar el grupo de expertos participantes se podra realizar mediante un muestreo a
criterio.
6.3.El tamao muestral.
Una vez obtenida la muestra, el siguiente paso a llevar a cabo es cuntos individuos
debe tener dicha muestra, es decir, su tamao. Para ello debemos tener en cuenta varias
consideraciones:
o El tamao muestral estar asociado a la frecuencia del evento que deseamos
medir.
o El tamao tambin ir en funcin del mximo error de muestreo que el
investigador est dispuesto a admitir al estimar un parmetro.
o Por ltimo, la complejidad del diseo tambin influir sobre el tamao de la
muestra, cuanto ms complejo sea dicho diseo mayor deber ser la muestra.
El investigador deber tener en cuenta qu tipo de variables quiere estimar en las
muestras para hacer sus inferencias en la poblacin, es decir, si lo que desea inferir es una
media, hablaremos de una variable cuantitativa, mientras que si se trata de una proporcin,
hablaremos de una variable cualitativa
7. Bibliografa
Abraira Santos V. Contraste de hiptesis: el valor p. SEMERGEN 28: 374-375. 2002.
Abraira Santos V. Inferencia estadstica bayesiana. SEMERGEN 31: 18-20. 2005.
Garca Salinero, J. Anlisis de datos en los estudios epidemiolgicos V. Prueba de Chi
cuadrado y anlisis de la Varianza. Nure Investigacin n 16, junio 2005.
Garca Salinero, J. Anlisis de datos en los estudios epidemiolgicos IV. Estadstica
Inferencial. Nure Investigacin n 19; noviembre-diciembre 2005.
http://www.fisterra.com/mbe/investiga/chi/chi.asp.
http://www.fisterra.com/mbe/investiga/t_student.asp.
http://www.hrc.es/bioest/M_docente.html.
Prez de Vargas A, Abraira Santos V, Bioestadstica. editorial C. De E. Ramn areces.
Madrid, 1996.
Robledo Martn, J. Diseos de muestreo (II). Nure Investigacin n 12, Febrero 2005.
Robledo Martn, J. Diseos de muestreos probabilsticos (I). Nure Investigacin n 11;
diciembre 2004.
Ruiz-Maya Prez L., Martn Pliego F.J., Fundamentos de Inferencia Estadstica 3 ed.;
editorial AC, 2007.
Seoane Rey J, Rechea C, Diges M, Martnez Arias MR, Maci Antn MA. Psicologa
Matemtica I. 7 ed; editorial UNED, 1994.
Tomeo Perucha V., Ua Juarez I., Lecciones de Estadstica Descriptiva; editorial
Thomson, 2003
39
Anexo 1
40
Anexo 2.Tabla de la t de student.
Anexo 3. Distribucin de chI cuadrado.
41
Anexo 3.Distribucin de CHI cuadrado.