Modulo 6
Modulo 6
Modulo 6
OBJETIVOS
EJES TEMÁTICOS
2. Problema de cuantificación.
3. Problemas de correlación.
Estudios retrospectivos
Estudios Prospectivos
En este tipo de estudios se miden los efectos que produce una determinada causa. Son
muy utilizados en estudios epidemiológicos, donde la causa es bien conocida y lo que se
evalúan son los efectos a corto, mediano o largo plazo. Es importante definir exactamente
la población en estudio y las condiciones de inclusión o exclusión, ya que las
observaciones se realizarán exclusivamente sobre la población definida inicialmente.
Imaginemos que intentamos realizar un estudio prospectivo de los efectos de la
exposición de una población determinada a un insecticida. Para ello necesitamos definir la
población sujeta al estudio (expuesto y no expuesto) y se la observa a través del tiempo.
El seguimiento se realiza mediante la aplicación de cuestionarios, exámenes clínicos
periódicos u otras metodologías definidas previamente. La duración del seguimiento varía
de algunos meses hasta varios años, hasta que se presente el efecto postulado en
nuestra hipótesis.
Siempre depende del objetivo planteado y de las hipótesis postuladas, sin embargo, es
importante evaluar situaciones referidas a:
• Diseños transversales o
transeccionales: Son los que Una Investigación es Transversal, cuando se
estudian las variables simultáneamente en un
realizan observaciones en un determinado momento. El tiempo no es importante,
momento único. Dentro de este se estudia un fenómeno en relación a como se da en
grupo, los que miden variables ese momento dado.
de manera individual e informan Por ejemplo: se miden las alteraciones
nutricionales en niños de 4 a 6 años, atendidos en
esas mediciones son llamados
el Hospital Fernández, Año 2008.
descriptivos. Sin embargo,
cuando describen relaciones entre variables son correlacionales y, si pueden
establecer procesos de causalidad entre variables son de tipo correlacionales /
causales.
En los diseños experimentales sabemos que al menos una de las variables involucradas
en el estudio es manipulada. Por este motivo, podemos definir, dentro de las
características del diseño experimental, lo siguiente:
• Manipulación: consiste en la intervención deliberada del investigador para
producir cambios en la variable dependiente.
• Aleatorización: también pueden controlarse los efectos de la manipulación.
Dentro de este punto, es posible considerar que los diseños experimentales
pueden ser:
auténticamente experimentales: cuando no presentan problemas
de validez interna, también llamados experimentales verdaderos.
cuasi experimentales: cuando pueden existir variables que
confunden. Por ejemplo, si un investigador determina que A es
causa de B, pero no puede asegurar que A también puede causar
C o D.
Los datos que proporcionan otras ciencias experimentales, como la física o la química son
diferentes a los que se obtienen en ciencias de la salud. En las primeras, la repetición de
los experimentos debe dar lugar a idénticos resultados (dejando de lado los errores de
manipulación o los errores de medición de los instrumentos). En cambio, en las ciencias
de la salud se añade la variabilidad biológica de los sujetos experimentales. De hecho, un
individuo es diferente de otro por lo menos en alguna variable, o, incluso, el mismo
individuo es diferente en diferentes momentos. Por ello, el modo de obtener resultados
científicamente válidos a partir de estos datos es utilizar términos de probabilidad. A
pesar de estas realidades, existe una creciente cuantificación en los estudios de las
ciencias biomédicas.
Existe un estudio acerca de una muestra de artículos publicados en una revista científica,
donde el autor determina que el 50% de los artículos no tenían un estudio estadístico o el
mismo era totalmente inadecuado y el 72% de los mismos tenían un diseño incorrecto,
imaginen las consecuencias de aplicar estos resultados a la aprobación de un fármaco a
nivel masivo. A raíz de la creciente importancia de la aplicación estadística a las ciencias
en general, y a las ciencias biomédicas en particular, tanto los organismos de control
como el mundo científico a través de sus medios de publicación (Congresos, Simposios o
revistas especializadas) son cada vez más exigentes en el correcto tratamiento
estadístico.
Sin embargo, debemos aclarar que la estadística no va a solucionar por sí sola los
problemas de validación. En realidad, los procedimientos estadísticos son sólo
metodologías rigurosas que nos permiten analizar los resultados y contrastar nuestras
hipótesis.
3. PROBLEMAS DE CORRELACIÓN
Una condición previa, en las técnicas lineales, es que la nube de puntos debe tender a
la linealidad y los coeficientes de regresión lineal, la ordenada en el origen (a) y la
pendiente de la recta (b), son estadísticos muestrales que se representan en la forma:
y = a + bx.
Con esta técnica de ajuste a la recta, podemos ver que hay puntos más cercanos a
ella y otros que se alejan, si se toma la distancia en vertical de cada punto a la recta
de regresión, obtendremos los valores de desviación estándar de cada punto. Es
posible, que estudiando una variable bidimensional, no se desee establecer ninguna
relación de subordinación de una variable con respecto a la otra. En este supuesto, se
intenta cuantificar la asociación entre las dos características. Entramos en las técnicas
de correlación lineal. Es posible definir otro estadístico muestral a partir del las dos
pendientes teóricas de las dos posibles rectas de regresión (y) sobre(x) y de (x) sobre
(y). Este estadístico es el coeficiente de correlación r. Su cuadrado r2 es el coeficiente
de determinación y da una medida entre 0 y 1 de la cantidad de información
compartida por dos características o variables continuas en los datos muestrales.
El hecho de que dos variables estén correlacionadas, aunque muestren valores muy
cercanos a 1, no implica que exista una relación de causalidad entre ellas. Se pueden
producir correlaciones causales entre dos variables, por estar ambas relacionadas con
otra tercera.
X Y
Veamos un ejemplo:
Los datos multivariados surgen cuando a un mismo individuo se le mide más de una
característica de interés. Un individuo puede ser un objeto o concepto que se puede
medir. Los principales objetivos de las técnicas multivariadas son:
En los métodos multivariados, se supone que las variables están correlacionadas, pero
las observaciones sobre los individuos son independientes. Generalmente se supone
también que el conjunto de variables que intervienen en el análisis poseen una
distribución normal multivariada. Esta suposición permite que el análisis multivariado
se desarrolle paralelamente al correspondiente análisis univariado basado en una
distribución normal.
El ACP es una técnica estadística propuesta por Karl Pearson como parte del análisis
de factores. El objetivo principal del ACP es la representación de las medidas
numéricas de varias variables en un espacio de pocas dimensiones donde nuestros
sentidos puedan percibir relaciones que de otra manera permanecerían ocultas en
dimensiones superiores. Dicha representación debe ser tal que al desechar
dimensiones superiores la pérdida de información sea mínima. El ACP permite reducir
la dimensionalidad de los datos, transformando el conjunto de p variables originales en
otro conjunto de q variables incorrelacionadas, llamadas componentes principales. Las
p variables son medidas sobre cada uno de los n individuos, obteniéndose una matriz
de datos de orden np (p < n). En el ACP existe la opción de usar la matriz de
correlaciones o bien, la matriz de covarianzas. En la primera opción se le está dando
la misma importancia a todas y a cada una de las variables; esto puede ser
conveniente cuando el investigador considera que todas las variables son igualmente
relevantes. La segunda opción se puede utilizar cuando todas las variables tengan las
mismas unidades de medida y además, cuando el investigador juzga conveniente
destacar cada una de las variables en función de su grado de variabilidad. Las q
nuevas variables (componentes principales) son obtenidas como combinaciones
lineales de las variables originales. Los componentes se ordenan en función del
porcentaje de varianza explicada. En este sentido, el primer componente será el más
importante por ser el que explica mayor porcentaje de la varianza de los datos. Queda
a criterio del investigador decidir cuántos componentes se elegirán en el estudio. El
ACP tiene la ventaja de no exigir supuestos tales como la normalidad.
Análisis Discriminantes