Introduccion Al Diseño de Investigacion

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

PARTE 1: INTRODUCCIÓN

1 INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

Índice de contenido
1. Problemas e hipótesis de investigación .................................................................... 2
2. Métodos de investigación científica ........................................................................... 4
3. Diseños de investigación. Criterios de clasificación .................................................. 5
3.1. Número de variables dependientes o criterios ............................................ 5
3.2. Número de variables independientes o predictoras .................................... 5
3.3. Número de valores de las VVII ................................................................... 6
3.4. Estrategia de recogida de los datos ............................................................ 6
4. Escalas de medida de las variables .......................................................................... 7
5. Selección de la técnica estadística adecuada ........................................................... 8
6. La validez de la investigación ................................................................................. 10
6.1. Validez interna .......................................................................................... 10
6.1.1. Aleatorización ............................................................................. 10
6.1.2. Balanceo o bloqueo .................................................................... 11
6.1.3. Constancia ................................................................................. 12
6.2. Validez de conclusión estadística ............................................................. 13
6.3. Validez externa ......................................................................................... 13
6.4. Validez de constructo ............................................................................... 14
Referencias ................................................................................................................ 15
Mª Eva Trigo Sánchez 2
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

En sentido general, el concepto de diseño hace referencia a la planificación del


proceso de recogida y análisis de los datos necesarios para responder a una pregunta
de investigación. Incluye por tanto todas aquellas decisiones relacionadas con la
elección de las variables a estudiar, sus posibles valores, el procedimiento a seguir
para recogerlos y la técnica de análisis estadístico que podrá utilizarse. Una vez
decidida ésta, comenzará el análisis de los datos propiamente dicho, al que
dedicaremos gran parte de los temas posteriores. Pero antes de todo ello debemos
hacer referencia a los problemas e hipótesis de investigación que dan lugar a un
determinado diseño y técnica de análisis.

1. Problemas e hipótesis de investigación


Existen dos tipos generales de problemas de investigación, sobre variables y sobre
relaciones entre ellas. En el primer caso se trata de conocer la ocurrencia de los
valores de una única variable. Por ejemplo, podríamos preguntarnos cómo se
organizan libremente, de forma individual o en grupo, los niños de una determinada
edad para trabajar en equipo en las tareas escolares. Se trata simplemente de conocer
la ocurrencia de los dos valores posibles de la variable tipo de organización, individual
o grupal. Otros ejemplos de problemas sobre variables de naturaleza psicológica
serían preguntarnos por el rendimiento de un grupo de sujetos en una prueba de
inteligencia, el comportamiento social de un individuo o las preferencias televisivas de
los adolescentes.
En cambio, un problema sobre la relación entre dos variables1 trata de
averiguar si entre ellas existe covariación, es decir, si a diferentes niveles de una
variable le corresponden sistemáticamente diferentes valores de la otra. Por ejemplo,
podríamos estudiar qué cambios psicosociales acompañan al deterioro de la actividad
mental que se produce en algunas personas mayores Las variables implicadas serían
los cambios psicosociales por un lado y el grado de deterioro de la actividad mental
por el otro. También podríamos estudiar si el rendimiento en una tarea de
discriminación musical depende del entrenamiento recibido por los sujetos, analizar las
diferentes prácticas de crianza en función de las características familiares, y estudiar
las variaciones en los procesos de razonamiento en función de la edad o la
covariación entre el rendimiento en una prueba verbal y otra espacial. En ocasiones,
no sólo se pretende averiguar si las variables están relacionadas, sino definir a través
de un modelo matemático la forma que adopta dicha relación. Se trata entonces de
predecir los valores que tomaría la VD ante diversos valores, previamente estudiados
o no, de la VI.
En todo problema relacional es posible distinguir al menos dos términos o
variables: una variable independiente (VI) o predictora y una variable dependiente (VD)
o criterio. Esta última es la variable sobre la que se piensa influye la independiente,
cambia según se produzcan cambios en la independiente o simplemente cuyos datos
van a expresarse en función de ella. En los ejemplos relacionales previamente
planteados el tipo de entrenamiento musical, las características familiares y la edad
aparecen claramente especificadas como independientes o predictoras; el rendimiento
en una prueba de discriminación musical, las prácticas de crianza y los procesos de
razonamiento como dependientes o criterio. En cambio, en el caso de la covariación
entre el rendimiento verbal y el espacial sería necesario saber qué datos van a ser
predichos por qué otros para asignar adecuadamente las denominaciones
explicitadas.
Además, todo problema, relacional o no, incluye de forma más o menos
explícita un núcleo y un contexto. El núcleo es el objetivo de estudio y el contexto hace
1
Por el momento, nos centraremos en problemas relacionales con dos variables únicamente,
aunque más adelante abordaremos también problemas relacionales más complejos.
Mª Eva Trigo Sánchez 3
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

referencia a la situación en la que el núcleo va a ser estudiado. A las variables que


especifican dicho contexto se las denomina usualmente variables extrañas (VVEE).
Así, planteando como núcleo el rendimiento en una prueba de inteligencia, el contexto
podría quedar definido por las circunstancias ambientales (por ejemplo en el aula de
clase, de forma anónima y estando el profesor presente) y las variables de sujeto (por
ejemplo sujetos de un curso de 8º de EGB. de un colegio público de Sevilla) en que va
a estudiarse dicho núcleo. Planteando como núcleo la covariación entre las prácticas
de crianza y la edad de los padres, el contexto podría definirse especificando si el
estudio va a hacerse con sujetos de todas las clases sociales o sólo en alguna o
algunas de ellas, determinando la situación en que van a observarse dichas prácticas,
etc. Estas variables extrañas son variables potencialmente independientes, ya que lo
considerado contexto por un equipo de investigación puede ser el centro de interés
para otro, e incluso para el mismo en otro momento diferente. Así, en vez de estudiar
la relación entre las prácticas de crianza y la edad de los padres en un contexto
determinado de clases sociales, el interés de otro equipo de investigación podría
centrarse en la relación entre las prácticas de crianza y la clase social, considerando la
edad de los padres como variable extraña.
Sin embargo, no es habitual plantearse un problema de investigación sin más,
sin tener una cierta idea sobre cómo va a resolverse finalmente. Dependiendo del
grado de conocimiento sobre la temática de investigación será posible plantear
hipótesis o hipotéticas soluciones al mismo más o menos específicas. En los
problemas no relacionales se hipotetizará sobre la existencia de determinados valores
de las variables; en los problemas relacionales las hipótesis versarán sobre la
existencia y/o la forma de la relación entre las variables. A este ámbito relacional
haremos referencia de forma exclusiva a partir de ahora.
A veces sólo es posible llegar a predecir que la relación esperada va a darse.
Es decir, se predice que van a encontrarse diferencias en los valores que adopta la
variable dependiente en función de los adoptados por la independiente, pero sin
atreverse a especificar qué valor de la VI pueden dar lugar a valores más altos de la
VD. Se plantea así una hipótesis bidireccional como posible solución al problema.
Supongamos que un investigador plantea como problema de investigación la relación
entre dos grados diferentes de veracidad de las instrucciones y la rapidez con que
llega a aprenderse una tarea. Dicho investigador podría afirmar a continuación que
habrá relación entre los términos, es decir que la velocidad de aprendizaje será
diferente ante grados de veracidad de las instrucciones distintas, sin especificar qué
instrucciones de las utilizadas darán lugar a un mejor rendimiento. Habrá planteado
una hipótesis bidireccional.
Con mucha menor frecuencia se plantean hipótesis bidireccionales sobre la
ausencia de covariación entre las variables, ya que resulta más relevante identificar
factores explicativos que no explicativos de las variaciones encontradas en el
comportamiento. Aun así, en determinadas situaciones pueden tener sentido.
Supongamos que se está interesado en probar un nuevo material didáctico para la
enseñanza de la lectura. La decisión de iniciar dicha prueba podría condicionarse, por
razones motivacionales, al hecho de que inicialmente no existan diferencias entre las
preferencias de los sujetos por uno u otro material. Si un investigador está convencido
de que efectivamente estas diferencias no existen, podría llevar a cabo un estudio
para demostrar su hipótesis, y con ello alentar la utilización del nuevo material.
Por el contrario, cuando se plantea la existencia de una relación entre las
variables en un sentido determinado estamos ante una hipótesis unidireccional. En tal
caso se predice no sólo que se darán diferencias en la VD en función de la VI, sino
también qué valor de la VI pueden conllevar los valores más altos en la VD. Este tipo
de predicciones implican un mayor conocimiento previo del tema de estudio. Volvamos
a la investigación sobre los dos grados diferentes de veracidad de las instrucciones y
la rapidez con que llega a aprenderse una tarea. Ante el mismo problema otro
investigador podría arriesgarse a afirmar no sólo que existirá relación, sino que ésta se
Mª Eva Trigo Sánchez 4
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

dará en un sentido particular, por ejemplo afirmando que la ejecución será más rápida
cuanto más veraces sean las instrucciones. Estaremos entonces ante una hipótesis
unidireccional.
En términos estadísticos la distinción entre una hipótesis bidireccional y otra
unidireccional también es relevante. Así, cuando se contrastan hipótesis
bidireccionales, será obligatorio que la prueba estadística de hipótesis nula sea
bidireccional o de dos colas. Para ello, bastará con decidir sobre la aceptación o
rechazo de H0 en función de las probabilidades bidireccionales proporcionadas por los
paquetes estadísticos al uso. En cambio, cuando la hipótesis de partida es
unidireccional, tenemos la oportunidad de elegir entre un contraste bidireccional o
unidireccional, de una cola. Como veremos, con los contrastes de una cola
obtendremos mayor potencia estadística relativa. Abordaremos extensamente este
concepto de potencia y otros relacionados en el siguiente capítulo sobre pruebas
estadísticas de hipótesis nula.
Una vez planteado el problema o la hipótesis, comienza la planificación de la
recogida y análisis de los datos empíricos necesarios para responder a la pregunta de
investigación o contrastar la hipótesis. Dicho proceso de recolección y análisis de los
datos debe ajustarse al modo de trabajar de la ciencia para que las conclusiones
gocen de las mayores garantías de corrección o validez. La metodología científica
proporciona las herramientas necesarias para ello, pero, como veremos a
continuación, el método científico no es único.

2. Métodos de investigación científica


El método de investigación hace referencia a una parte del procedimiento utilizado
para recoger los datos empíricos necesarios y dar respuesta al problema o contrastar
la hipótesis de investigación planteados. La clasificación más general de estos
procedimientos puede realizarse en función del grado de control del investigador/a 2
sobre los valores de la VI obtenidos, dando lugar a la distinción entre los métodos
correlacional de encuesta, correlacional selectivo y experimental. En todos ellos los
valores de la VD obtenidos dependen directamente de las respuestas emitidas por los
sujetos de la investigación, pero no ocurre lo mismo respecto a la VI y sus valores.
Así, en la metodología correlacional de encuesta el investigador/a decide con
qué muestra de sujetos va a trabajar y en qué situación, así como el momento
concreto en que recogerá los valores de las variables y a través de qué materiales,
pero dichos valores, incluidos los de la VI o variable predictora, dependen de la
respuesta de los sujetos. Supongamos que un investigador desea conocer la relación
entre el tiempo de estudio y el recuerdo de un texto. Podría utilizar para ello diferentes
estrategias de investigación. Si decidiese simplemente preguntar a los sujetos
seleccionados el tiempo que ha estudiado cada uno y medir su recuerdo, diríamos que
ha planteado una investigación de tipo correlacional de encuesta, ya que tanto los
valores de la VD como los de la VI dependen de los sujetos.
En cambio, en el denominado método correlacional selectivo el investigador/a
decide qué valores de la VI va a utilizar, aunque no puede producirlos cómo y cuándo
desea, sino que selecciona sujetos que ya poseen esos determinados valores, de ahí
su nombre. Siguiendo con el problema de investigación anterior, podría seleccionar
para su investigación sólo aquellos sujetos que dedicasen unos determinados valores
de horas de estudio, por ejemplo menos de 5 horas y más de 10, para estudiar su
recuerdo. Estaría planteando así un estudio correlacional selectivo.
Finalmente en una investigación experimental no sólo es posible planificar con
qué sujetos, cuando y con qué valores de la VI se trabajará; también es posible

2
La metodología observacional, caracterizada por la observación del comportamiento
espontáneo en un contexto no planificado, supondría el mínimo grado de control por parte del
investigador/a.
Mª Eva Trigo Sánchez 5
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

planificar el valor concreto de la VI que recibirá cada sujeto. Estudiar


experimentalmente la relación entre las variables anteriores requeriría, además de
decidir unos determinados valores de la VI “horas de estudio”, poder decidir el tiempo
de estudio que debe cumplir cada sujeto antes de medir su recuerdo. A este control
sobre los niveles de la VI se le denomina manipulación, y los diferentes valores
producidos reciben la denominación de tratamientos o condiciones experimentales.
Dicha manipulación de la VI implica presentar o producir aquellos valores de la VI que
el investigador desea en un determinado momento temporal, previo a la recogida de
los datos de la VD. Así se hace posible observar la relación temporal entre el factor o
causa (antecedente) y la conducta o efecto (consecuente), pudiendo defender en
mayor medida la existencia de una relación causal entre las variables.
En cualquier caso, el método de investigación científico adoptado no es la
única cuestión de procedimiento que define a un estudio empírico ni determina la
técnica de análisis estadístico más adecuada al mismo. Muchas otras características
relacionadas con el procedimiento determinan el análisis que se realizará
posteriormente, entre ellas el denominado diseño de investigación.

3. Diseños de investigación. Criterios de clasificación


En un sentido más específico, el diseño de investigación hace referencia al número de
variables y valores de éstas, así como a la estrategia temporal de recogida de los
datos sobre dichas variables. A continuación analizamos la nomenclatura utilizada
para clasificar los diseños y técnicas de análisis en función de estos criterios.

3.1. Número de variables dependientes o criterios


Para empezar, podemos diferenciar entre diseños en función del número de variables
dependientes analizadas simultáneamente. Cuando se recoge una única medida del
comportamiento de los sujetos, una única VD para ser predicha o explicada por otra/s,
el diseño se denomina univariado. Habitualmente suele utilizarse la letra “Y” para
hacer referencia a los datos de esta única VD. Sin embargo, en muchas ocasiones es
frecuente analizar más de un comportamiento o recoger más de una medida diferente
del mismo comportamiento. En tal caso podemos decidir analizar cada una de ellas
por separado, como si cada una de ellas se hubiese obtenido en una investigación
diferente, conformando diversos diseños univariados. Las técnicas de análisis
estadístico asociadas a este tipo de diseños se denominan univariantes. No obstante,
en los últimos años ha tenido lugar un aumento de los enfoques multivariados, que
tienen en cuenta la covariación entre las diferentes variables dependientes registradas,
analizando una combinación lineal de ellas. Las técnicas de análisis estadístico
asociadas a estos diseños multivariados se denominan multivariantes (por ejemplo,
análisis multivariante de la varianza).

3.2. Número de variables independientes o predictoras


En general, se denomina al diseño univariable si existe sólo una VI y multivariable si
se estudian varias. Así, serían ejemplos de diseños univariables estudiar la posible
influencia del ambiente de estudio, ruidoso o no, sobre el rendimiento académico, o
estudiar la conformidad de los sujetos con opiniones ajenas en función de la fama de
los sujetos que las expresan. Serían ejemplos de diseños multivariables estudiar
conjuntamente la posible influencia del ambiente de estudio y el tiempo de estudio
sobre el rendimiento académico; también estudiar la conformidad de los sujetos con
opiniones ajenas dependiendo de la fama y de la cantidad de sujetos que las
expresan. A estas variables independientes se les designa convencionalmente por
letras mayúsculas del alfabeto (A, B, C, X, Z…). La nomenclatura estadística asociada
a los diseños multivariables suele ser el término múltiple (por ejemplo, regresión lineal
múltiple). Cuando la metodología utilizada es correlacional selectiva o experimental y
además se recogen datos de todas las combinaciones de los valores de las variables
Mª Eva Trigo Sánchez 6
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

(por ejemplo, pocos sujetos famosos, muchos sujetos famosos, pocos sujetos no
famosos y muchos sujetos no famosos), el diseño, y en ocasiones la técnica de
análisis, se denomina factorial (por ejemplo, análisis factorial de la varianza).

3.3. Número de valores de las VVII


Este criterio no tiene aplicación en el caso de las investigaciones correlacionales de
encuesta, ya que en ellas no puede saberse a priori el número de valores de la VI. Sí
se aplica en cambio en las investigaciones correlacionales selectivas o
experimentales. Así, cuando se trabaja únicamente con una variable independiente se
utiliza la nomenclatura bicondicional versus multicondicional o multigrupo para
distinguir entre la utilización de dos valores versus más de dos valores
respectivamente. Serían ejemplos de diseños bicondicionales estudiar la influencia del
tipo de música, clásica o rock, sobre el recuerdo; así como estudiar la covariación
entre la velocidad del aprendizaje y la presencia o ausencia de reforzamiento positivo
para las ejecuciones correctas. Serían ejemplos de diseños multicondicionales
estudiar la influencia del tipo de música, clásica, moderna instrumental, moderna con
letras repetitivas o con letras no repetitivas, sobre el recuerdo; también estudiar la
covariación entre la velocidad de aprendizaje y la presencia de reforzamiento positivo
de diferentes tipos: contingente y continuo, contingente intermitente y no contingente.
Los diferentes niveles de cada VI se nombran por las correspondientes letras
minúsculas y subíndices numéricos (por ejemplo a 1, a2, a3…). En las técnicas de
análisis estadístico aplicadas a este tipo de diseños también aparece con frecuencia el
término múltiple (por ejemplo, regresión lineal múltiple o comparaciones múltiples).
Por su parte, en las investigaciones factoriales simplemente se nombra al
diseño por el producto de la combinación de los niveles de cada variable
independiente. Supongamos que se estudia conjuntamente la influencia de dos
variables independientes, A y B (AxB), ambas con dos valores; se trataría de un
diseño factorial 2x2 ó 22, con 4 condiciones diferentes. Si se estudiara la covariación
de una variable dependiente con tres variables independientes (AxBxC), la primera
con tres niveles, la segunda con cuatro y la última con dos, se denominaría al diseño
factorial 3x4x2, contando con 24 condiciones diferentes de observación de la
conducta.

3.4. Estrategia de recogida de los datos


Básicamente pueden distinguirse dos estrategias temporales diferentes de recogida de
los datos: transversal y longitudinal. En una estrategia transversal las observaciones
sobre la VD se obtienen en un único momento temporal, por lo que deben participar en
la investigación tantos sujetos diferentes como observaciones de cada variable se
requieran. Así, si queremos analizar la covariación entre el rendimiento en una prueba
verbal y otra espacial y obtener 20 observaciones de la VD rendimiento espacial,
necesitaremos 20 sujetos. También necesitaríamos 20 sujetos para estudiar el
rendimiento espacial en función del género de los sujetos y obtener 20 observaciones
de la VD, 10 de cada nivel de género si queremos utilizar grupos de igual tamaño.
En cambio, en una estrategia longitudinal las observaciones sobre la VD se
obtienen en momentos temporales diferentes, aportando cada sujeto más de una
observación al estudio. Por tanto, será posible obtener un mayor número de
observaciones con el mismo número de sujetos que en una investigación transversal.
Por ejemplo, si quisiéramos estudiar el recuerdo de una lista de palabras en función
del número de repasos realizados por cada sujeto, 1, 2 ó 3 repasos, podríamos pedirle
a nuestros 20 sujetos que realizasen la tarea de recuerdo en tres ocasiones
temporales consecutivas, tras el primer, segundo y tercer repaso. Obtendríamos así un
total de 20x3 = 60 observaciones de la VD, 20 en cada nivel de la VI.
Este sistema de clasificación de los diseños puede resumirse en el siguiente
cuadro:
Mª Eva Trigo Sánchez 7
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

CRITERIO DISEÑO CRITERIO DISEÑO ESTADÍSTICA


Nº de una univariado univariante
VVDD varias multivariado multivariante
2
bicondicional
valores
una univariable
Nº de 3 o más multicondional o
múltiple
VVII valores multigrupo
multivariable múltiple
varias
factorial factorial
CRITERIO ESTRATEGIA DISEÑO ESTADÍSTICA
1 momento temporal transversal muestras
transversal
1 sujeto → 1 observación entregrupos independientes
longitudinal
varios momento temporales muestras
longitudinal medidas repetidas
1 sujeto → varias observaciones relacionadas
intrasujetos

Una vez determinado el método y el diseño de la investigación, tendremos una


idea aproximada del tipo de técnica estadística de análisis de los datos que podemos
utilizar, pero antes de decidirnos finalmente por una de ellas será imprescindible
conocer la escala de medida de las variables.

4. Escalas de medida de las variables


Un criterio fundamental para seleccionar la técnica de análisis estadístico más
adecuada al diseño será el tipo y rango de valores que pueden tomar las variables, su
escala de medida. Algunas variables admiten exclusivamente una escala nominal. En
tal caso, sobre los distintos valores de dicha variable sólo puede afirmarse si son
iguales o diferentes. Son ejemplos de utilización de una escala nominal el diferenciar a
los sujetos por su sexo: hombre o mujer; por el tipo de entrenamiento musical que han
recibido: basado en la audición exclusivamente, en la interpretación o en ambas cosas
a la vez; por el pasatiempo que prefieren: escuchar música, pasear, hacer
crucigramas, ver la televisión...
En otros casos es posible ir un paso más allá en la organización entre los
diferentes valores de la variable: pueden ordenarse en términos de mayor o menor.
Hablamos entonces de una escala ordinal. Son ejemplos de utilización de una escala
ordinal el diferenciar a los sujetos por su nivel de estudios: primarios, medios o
superiores; por la nota obtenida en una prueba de elección múltiple: suspenso,
aprobado, notable o sobresaliente; por el grado de adaptación a las normas: bajo,
medio o alto; o por la rapidez con que consiguen finalizar una tarea: el más rápido de
todos, el segundo más rápido... hasta el último de ellos.
Por último, a veces es posible no sólo ordenar los diferentes valores de una
variable, sino también identificar la cantidad de diferencia que existe entre unos y
otros. Hablamos entonces de una escala cuantitativa. Los incrementos de un valor a
otro pueden ser a priori infinitamente pequeños o suponer cantidades mayores. No
obstante, la imperfección de los instrumentos de medida siempre implica en la práctica
alguna limitación para detectar hasta las más ínfimas diferencias. Pueden
diferenciarse dos tipos de escalas de medida cuantitativas: de intervalo y de razón.
Hablamos de una escala de razón cuando el 0 de la escala coincide con la ausencia
de la característica psicológica que se esté midiendo, existiendo por tanto un 0
absoluto; cuando éste no existe hablamos de una escala de intervalo. Son ejemplos de
utilización de una escala de intervalo diferenciar a los sujetos por su capacidad
memorística medida a través del número de palabras recordadas de una lista o por su
experiencia previa en la tarea medida a través del número de días de entrenamiento.
Se entiende que recordar 0 palabras no significa ausencia absoluta de capacidad
memorística, al igual que recibir 0 días de entrenamiento no significa ausencia
absoluta de experiencia con la tarea. En tal caso no es posible afirmar, por ejemplo,
Mª Eva Trigo Sánchez 8
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

que un sujeto que recuerda dos palabras tiene el doble de capacidad memorística que
un sujeto que sólo recuerda una palabra. Simplemente informaríamos de la distancia
entre un sujeto y otro en términos de palabras recordadas. Serían ejemplos de
utilización de una escala de razón diferenciar a los sujetos por su tiempo de reacción
ante determinados estímulos o por los decibelios de ruido de fondo con que realizan
una tarea. Se entiende que un tiempo de reacción de 0 corresponde con la ausencia
absoluta de tiempo transcurrido entre la presentación del estímulo y la respuesta del
sujeto, así como una intensidad de 0 decibelios corresponde con la ausencia absoluta
de ruido de fondo. En tal caso sí sería posible afirmar por ejemplo que un sujeto con
un tiempo de reacción de dos segundos tarda en reaccionar el doble que uno con un
tiempo de reacción de un segundo. Sin embargo, es difícil imaginar la existencia de un
0 absoluto en la mayoría de las variables psicológicas
Conviene finalmente puntualizar que una misma variable puede admitir
opcionalmente diferentes escalamientos. Supongamos que se mide el conocimiento de
los sujetos en una determinada materia a través de una prueba de elección múltiple.
Un investigador/a puede optar por un escalamiento ordinal, utilizando para ello las
notas cualitativas obtenidas por los sujetos: suspenso, aprobado, notable o
sobresaliente. Otro investigador/a diferente podría en cambio optar por una escala de
intervalo, contabilizando el número de respuestas correctas para cada sujeto. En
ocasiones además, una variable, que hasta un momento determinado sólo admitía un
cierto grado de diferenciación entre sus valores, cambia de situación gracias a
avances técnicos conseguidos en los materiales e instrumentos de medida utilizados.
Como puede deducirse fácilmente, el nivel de escalamiento asumido para una
variable determinará el tipo de información que se recogerá de los datos, así como la
forma en que serán analizados. Si adoptamos un escalamiento ordinal para medir el
conocimiento de los sujetos en la materia evaluada debemos asumir, por ejemplo, que
todos los sujetos suspensos están siendo categorizados como de igual nivel de
conocimientos. De la misma forma, si adoptamos un escalamiento de intervalo
asumimos, por ejemplo, que un sujeto con una puntuación de 3 tiene un nivel de
conocimientos inferior a otro con una puntuación de 4.

5. Selección de la técnica estadística adecuada


Una vez conformado el diseño de investigación y decidido el procedimiento de
medida de cada variable, el abanico de posibles técnicas de análisis estadístico a utilizar
será mucho más reducido, aunque aún será necesario tener en cuenta un último criterio,
el grado de cumplimiento de los supuestos de cada prueba estadística, principalmente
los de normalidad y homocedasticidad. La descripción de estos supuestos y los errores
que su incumplimiento pueden provocar en una prueba estadística se abordarán
posteriormente. Por ahora, nos limitaremos a clasificar, en función de los criterios
previamente expuestos, las técnicas de análisis más recomendadas y utilizadas en los
diseños univariados, aunque en ocasiones dichas técnicas no son las únicas posibles. En
este sentido, algunas de las técnicas incluidas como diferentes en este cuadro resultan
equivalentes en determinadas situaciones; abordaremos detenidamente dichas
equivalencias en los temas posteriores.
Mª Eva Trigo Sánchez 9
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

Nº y naturaleza de las VVII Naturaleza de la VD Técnica de análisis


t de Student
cuantitativa+normal+homo
ANOVA (F de Snedecor)
t de Welch
1 IV categórica cuantitativa (no homo)
F de Welch
2 niveles
cuantitativa (no normal) U de Mann Whitney
(muestras independientes)
ordinal t o F de rangos
Chi-cuadrado
categórica
Prueba exacta de Fisher
cuantitativa+normal+homo ANOVA
1 IV categórica cuantitativa (no homo) F de Welch
más de 2 niveles cuantitativa (no normal)
(muestras independientes) ANOVA de Kruskal Wallis
ordinal
categórica Chi-cuadrado
t de Student
cuantitativa+normal
1 IV categórica ANOVA
2 niveles cuantitativa (no normal) Wilcoxon
(muestras relacionadas) ordinal Prueba de los signos
categórica McNemar
1 IV categórica cuantitativa+normal ANOVA
más de 2 cuantitativa (no normal)
ANOVA de Friedman
niveles ordinal
(muestras relacionadas) categórica regresión logística simple
cuantitativa+normal+homo ANOVA factorial
cuantitativa (no normal)
2 o más VVII categóricas ¿?
ordinal
categórica regresión logística simple
correlación de Pearson
cuantitativa+normal
regresión lineal simple
1 IV cuantitativa cuantitativa (no normal) correlación de Spearman
ordinal correlación de Kendall
categórica regresión logística
regresión lineal múltiple
1 o más VVII cuantitativas cuantitativa+normal
ANCOVA
y/o
regresión logística múltiple
1 o más VVII categóricas categórica
análisis discriminante

Nota: normal = se cumple el supuesto de normalidad; homo = se cumple el supuesto de


homocedasticidad

Para ayudarnos a seleccionar la prueba estadística más adecuada existen además


de estas tablas clásicas, algunas webs interactivas que pueden sernos de utilidad:

 http://www.socialresearchmethods.net/selstat/ssstart.htm
 http://www.microsiris.com/Statistical%20Decision%20Tree/how_many_variables.htm
 http://www.lssu.edu/faculty/jroese/recipes/Wizard/wiz_01.htm
 http://www.ats.ucla.edu/stat/mult_pkg/whatstat/default.htm (incluye instrucciones con
SPSS, Stata y SAS)

Estas y otras muchas decisiones que deben tomarse durante el proceso de diseño
de una investigación tienen como objetivo conseguir que ésta sea lo más correcta
posible, en términos técnicos que cuente con la mayor validez posible. Por ello,
finalizaremos esta introducción al diseño revisando brevemente el concepto de validez.
Mª Eva Trigo Sánchez 10
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

6. La validez de la investigación
Shadish, Cook y Cambell (2002) han propuesto cuatro tipos de validez, dos de ellas
relacionadas con el proceso de inferencia causal, especialmente importante en la
investigación experimental, y otras dos con las posibilidades de generalización de la
inferencia realizada (ver Ato y Vallejo, 2007 para un análisis detallado de cada tipo de
validez).

6.1. Validez interna


La validez interna hace referencia a la medida en que los cambios observados en la
VD son provocados por la VI y no por cualquier otra causa alternativa. En la
investigación experimental, tanto la manipulación de la VI como el control de las VVEE
relevantes tienen precisamente como objetivo garantizar la validez interna del estudio.
La manipulación de la VI garantiza la precedencia temporal de la causa respecto al
efecto, imprescindible para la inferencia causal. Por su parte, el control de las VVEE
evita la confusión entre dicha supuesta causa y otras alternativas. Las técnicas de
control tienen como objetivo neutralizar el efecto de las VVEE, evitando que los
valores de éstas covaríen sistemáticamente con los de la VI, y por tanto puedan
constituir una explicación alternativa a los cambios en la VD. En cambio, el grado de
control en las investigaciones correlacionales resulta necesariamente menor, ya que
resulta más difícil evitar la coincidencia de los valores de la VI con los de una VE
cuando dichos valores dependen de los sujetos, no de la manipulación del
investigador/a. A posteriori, la única opción posible, en caso de encontrar confusión
entre las variables, será el control de tipo estadístico proporcionado por algunas
técnicas de análisis, aunque éste nunca será tan efectivo como el ejercido a priori
durante el diseño de la investigación. A continuación se describen y ejemplifican las
diferentes técnicas de control en los diseños experimentales transversales, donde
debe cuidarse especialmente que los diferentes sujetos no se diferencien más que en
el valor de la VI antes de medir la VD. No obstante, también abordaremos en temas
posteriores las técnicas de control propias de los diseños longitudinales y las técnicas
de control estadístico.

6.1.1. Aleatorización
Una forma de neutralizar el efecto de múltiples VVEE de sujeto consiste asignar
aleatoriamente los sujetos a los diferentes grupos que participan en la investigación.
Supongamos que estuviésemos trabajando en una investigación con una única VI, A,
con dos valores diferentes, a 1 y a2, que van a ser aplicados a dos grupos diferentes de
sujetos. Para defender el efecto de la VI sobre la VD será necesario garantizar que la
única diferencia entre los dos grupos de sujetos es el nivel de VI recibido, y no las
características personales de los sujetos que componen cada grupo. Para controlar
simultáneamente todo este conjunto de VVEE de sujeto debemos utilizar la técnica de
control denominada aleatorización, que consiste en decidir al azar qué nivel de VI
recibirá cada uno de los sujetos de la muestra experimental. Como resultado, es
posible que los valores de una VE aleatorizada tomada aisladamente no estén
repartidos exactamente de la misma forma en los distintos grupos, pero consideradas
conjuntamente todas ellas tenderán a neutralizarse. Es decir, al formar los grupos
aleatoriamente es poco probable que en alguno de ellos coincidan al mismo tiempo
todas las características personales que pueden dar como resultado un mejor
rendimiento en términos de la VD. Por el contrario, en cada grupo se producirá una
mezcla aleatoria de características positivas y negativas en relación con dicha VD, sin
que sea posible identificar alguna de ellas en concreto como responsable de los
cambios en el comportamiento de los sujetos. Así por ejemplo, suponiendo que las
mujeres de mayor edad y experiencia en la tarea fuesen quienes mejor realizaran una
determinada tarea, sería posible que en uno de los grupos hubiese un mayor número
de mujeres que en el resto, pero a cambio pueden tener menor edad o experiencia en
la tarea. A continuación se ejemplifica esta mezcla aleatoria de características
Mª Eva Trigo Sánchez 11
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

positivas y negativas en una situación con tres VVEE, con dos valores distintos
representados por diferentes símbolos, y dos grupos experimentales, a 1 y a2.

a1
*** o
+---
****
oooo al azar
++++
---- a2
*ooo
+++-

La aplicación de la técnica de la aleatorización será fundamental en todos los


diseños de investigación que utilicen grupos diferentes de sujetos para los distintos
niveles de la VI. De hecho, la ausencia de aleatorización en la formación de los grupos
de tratamiento hace que el diseño no sea considerado experimental. Así, cuando en
una investigación se manipula la VI, pero no es posible controlar mediante
aleatorización las variables de sujeto, el diseño recibe la denominación de cuasi-
experimental. Supongamos que un investigador/a está interesado en probar la eficacia
de la enseñanza de la estadística asistida por ordenador frente al método tradicional
de lápiz y papel. Para ello decide utilizar un método diferente en cada una de los dos
horarios de prácticas disponibles. Si no realiza aleatoriamente la asignación de los
sujetos a los grupos no habrá forma de asegurar que la única variación entre ellos sea
el nivel de VI recibido, por lo que el diseño no tendrá un adecuado grado de control y
no podrá denominarse experimental. Por ejemplo, si se deja a los sujetos elegir
libremente el horario podría ocurrir que los que asisten a las clases con ordenador
sean los más convencidos de la adecuación de dicho método de enseñanza, factor
que puede hacer mejorar su rendimiento. Esta preferencia por el método de
enseñanza sería una VE confundida con la VI, siendo imposible desligar los efectos de
ambas.

6.1.2. Balanceo o bloqueo


En algunas ocasiones se considera que la importancia de alguna VE es tal que no
debemos dejarle al azar su control, sino planificar de antemano que sus valores estén
igualmente representados en cada tratamiento experimental. Hablaremos entonces del
balanceo o el bloqueo (si se trata de una VE de sujeto) como técnica de control. Así
por ejemplo, podríamos bloquear la VE edad de los sujetos experimentales (3 y 5
años) haciendo que en cada grupo de tratamiento haya igual número de sujetos de
ambas edades, por ejemplo, 4 sujetos de 3 años (▪) y 3 sujetos de 5 años (▫), tal y
como se esquematiza en la siguiente figura.

a1
Bloque 1 ▪▪▪▪
▪▪▪▪▪▪▪▪ ▫▫▫
VE 1
▪▫▪▪▫▪▪ al azar
▫▫▪▪▫▪▪▫
a2
Bloque 2 ▪▪▪▪
▫▫▫▫▫▫ ▫▫▫
Mª Eva Trigo Sánchez 12
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

Como puede observarse, el primer paso sería la medición de los valores de la


VE y la formación sistemática de tantos bloques como valores diferentes de la misma
decidamos utilizar. Es posible, como ocurre en nuestro ejemplo, que deban
desecharse algunos de los sujetos medidos inicialmente, bien porque no presenten los
valores de interés o porque necesitemos un número determinado de sujetos para que
el reparto entre los grupos experimentales sea equitativo. En nuestro ejemplo, sería
necesario desechar uno de los sujetos de tres años de la muestra inicial, ya que la
utilización de dos condiciones experimentales, a 1 y a2, requiere un número par de
sujetos de cada edad. Una vez formados los bloques en función de los distintos
valores de la VE que quiere controlarse mediante balanceo, los sujetos de cada bloque
deberán ser distribuidos aleatoriamente a las condiciones experimentales para
garantizar también el control de las restantes VVEE de sujeto. Respecto a la
aleatorización, el balanceo tiene como ventajas el hecho de proporcionar un control
más preciso sobre las VVEE balanceadas, así como la posibilidad de analizar
posteriormente el efecto de dichas variables, al tener los datos clasificados tanto en
función de la VI como del bloque de procedencia. Decimos que permiten la
sistematización de los efectos de la VE en el análisis de los datos. Sin embargo, esta
técnica tiene mayor coste experimental que la aleatorización, por lo que sólo tiene
sentido aplicarla sobre variables extrañas que realmente puedan tener un efecto
importante sobre la VD. Este es un primer motivo por el que sólo suelen balancearse
unas pocas variables en cada estudio; otro reside en las dificultades para encontrar
sujetos que presenten al mismo tiempo determinados valores de dos o más variables
extrañas.

6.1.3. Constancia
Otra forma de asegurar la neutralización de algunas VVEE concretas consiste en
utilizar un único valor de éstas, ya que si no presentan variación alguna, no pueden
explicar las variaciones encontradas en la VD. Esta técnica de control recibe el nombre
de constancia o mantenimiento constante, denominándose eliminación cuando se
utiliza el valor 0 de la VE. Por ejemplo, si la tarea se realiza en ausencia de ruido
hablaríamos de la eliminación de la VE ruido. En la siguiente figura se esquematiza
dicha técnica.

a1
▪▪▪▪

VE 1 al azar
▪▪▪▪▪▪▪▪
a2
▪▪▪▪

Como puede comprobarse, aunque algunas de estas VVEE de sujeto pueden


bloquearse o mantenerse constantes, la aleatorización seguirá siendo una técnica de
control imprescindible para controlar simultáneamente las restantes VVEE individuales
en todos los diseños experimentales que utilicen grupos de sujetos distintos. A
diferencia, en los diseños correlacionales, la técnica de la aleatorización no puede ser
aplicada, ya que los niveles de VI no pueden aplicarse al azar, sino que dependen de
los sujetos. Sí podrían aplicarse en cambio la constancia en cualquier diseño
correlacional y el bloqueo en los diseños correlacionales selectivos, siempre que la
distribución natural de las variables en la población nos permita encontrar sujetos de
cada nivel de VI con los valores de VVEE requeridos.
Mª Eva Trigo Sánchez 13
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

6.2. Validez de conclusión estadística


Un segundo tipo de validez relacionado con la inferencia causal está relacionado con
la correcta selección y aplicación de las pruebas estadísticas y la corrección del
proceso de inferencia una vez aplicadas. En un sentido amplio, podría afirmarse que el
contenido del resto de este manual se centra precisamente en la validez de conclusión
estadística ante diferentes situaciones experimentales y correlacionales, por lo que no
abundaremos más sobre este aspecto en esta introducción.

6.3. Validez externa


Entre el segundo grupo de condiciones de validez, relacionado con las posibilidades
de generalización de la inferencia realizada, destaca en primer lugar la validez externa.
Ésta se refiere a la medida en que los resultados obtenidos pueden volver a obtenerse
en estudios relativamente similares, adquiriendo un cierto grado de generalidad. Hace
referencia por tanto a la replicabilidad empírica del fenómeno observado con otros
sujetos, en un contexto diferente, con otros procedimientos de manipulación de la VI,
con otras medidas de la VD, con otros métodos de investigación…
Un aspecto fundamental en la generalidad de los resultados obtenidos tiene
que ver con la selección de la muestra utilizada en el estudio. No es posible trabajar de
acuerdo con el método de la ciencia recogiendo un único dato. No se puede analizar la
covariación entre una VI y una VD a partir de una única observación, ya que el
resultado de dicho análisis podría muy bien ser fruto de la coincidencia casual de una
serie de factores en la situación de estudio. Se requiere por tanto todo un conjunto de
observaciones para analizar si la covariación esperada es o no consistente. Pero así
como no es posible trabajar con un único dato, tampoco es habitual trabajar con todos
los datos posibles de unas determinadas características, con toda una población de
observaciones, sino con un subconjunto o muestra de las mismas. Cuanto mejor
represente la muestra a la población de referencia más fácil será defender la
generalización a la población de los resultados obtenidos en la muestra y mayor será
la validez externa de la misma. Para evaluar estas posibilidades será imprescindible
definir con claridad las características de la población a partir de la cual se extraen los
datos y el proceso utilizado para extraer la muestra a partir de la misma, ya que una
covariación encontrada en un contexto determinado puede no darse en otro
relativamente diferente.
En Psicología resulta frecuente querer generalizar los resultados obtenidos en
una investigación a otros sujetos diferentes a los utilizados; de hecho suele asociarse
el término muestreo a los procedimientos de selección de sujetos. Sin embargo, las
características de los sujetos no son las únicas variables extrañas que definen el
contexto del estudio, sino también otras de orden ambiental o espacio-temporal.
Desde el momento en que exista necesidad de generalizar los resultados a otras
condiciones ambientales, temporales, etc., será necesario muestrear también dichas
situaciones.
Pero ¿por qué trabajar con una muestra y no con toda la población? Las
razones son de índole práctica. Para empezar, la mayoría de las veces sería imposible
trabajar con toda una población de datos. Pero además, en caso de que fuese posible,
resultaría una elevada razón coste/beneficio, incluso cuando se tiene un interés
especial en la generalización de sus conclusiones. Dado un buen procedimiento de
extracción aleatoria de la muestra a partir de la población, es decir un buen diseño de
muestreo, puede estimarse con un determinado riesgo de equivocación lo que
ocurriría en la población sin necesidad de trabajar con ella.
En otras ocasiones simplemente no estamos demasiado interesados en poder
realizar afirmaciones acerca de toda la población, centrando nuestra atención más en
la validez interna del estudio que en la externa. En este sentido, es frecuente que los
psicólogos/as definan las poblaciones como aquel grupo mayor de individuos a partir
del cual podría haberse obtenido aleatoriamente la muestra (Gardner, 2003), sin haber
realizado realmente dicho proceso. Como consecuencia de la ausencia de muestreo
Mª Eva Trigo Sánchez 14
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

aleatorio, se hace difícil generalizar estadísticamente los resultados de la investigación


a la población de referencia. A diferencia, gran parte del proceso de generalización a
poblaciones y circunstancias reales se fundamentará en aspectos no estadísticos. En
este sentido, es fundamental analizar la consistencia o no entre los datos de diferentes
réplicas de una investigación, realizadas con diferentes sub-poblaciones. La
replicación directa de una investigación consiste precisamente en repetir una
investigación previa con otra muestra de sujetos diferente. Cuando además de los
sujetos cambia algún otro aspecto de la investigación se le denomina replicación
sistemática. Analizando la estabilidad de las covariaciones a través de diferentes
investigaciones es como se puede llegar a hacer afirmaciones con un grado adecuado
de validez externa, aplicables más allá de la muestra concreta con la que se ha
realizado la investigación.

6.4. Validez de constructo


Finalmente, la validez de constructo está relacionada con la adecuación del
procedimiento por el que los conceptos teóricos, los constructos, que no pueden ser
directamente observados o medidos, se traducen en indicadores medibles y
observables dentro de nuestra investigación. Para poder llevar a la práctica cualquier
investigación es necesario no sólo especificar las variables que quieren estudiarse,
sino también las formas concretas en que van a estudiarse. Ello implica en primer
lugar especificar las operaciones necesarias para observar, medir o manipular las
variables del estudio, operativizar las variables. Así, una misma variable podría dar
lugar a diferentes medidas de la misma, obtenidas a través de distintos procedimientos
y operaciones. Por ejemplo, el CI de los sujetos podría medirse a través de dos tests
de inteligencia diferentes. De igual forma, podría medirse el rendimiento en una tarea a
través del tiempo que tardan los sujetos en resolver correctamente todos los apartados
de la misma o a través del número de apartados correctamente resueltos durante 10
minutos.
Esta operativización de las variables tiene entre sus objetivos facilitar la
replicación de la investigación en otras ocasiones y/u otros laboratorios, pero también
permitir una evaluación del grado de adecuación entre la variable que quiere
estudiarse y la operación desarrollada para ello. Así, el objetivo de una buena
operativización es conseguir que la correlación entre lo que queremos observar, medir
y/o registrar y los datos proporcionados por los instrumentos de que disponemos para
ello, es decir lo que realmente observamos, medimos y/o registramos, sea lo más
perfecta posible. En síntesis, se trata de intentar una buena correspondencia entre el
plano conceptual, donde se enmarca el problema delimitado, y el plano empírico, en el
que "reducimos" dichos conceptos a operaciones.
Dos conceptos íntimamente relacionados con esta correspondencia ideal entre
los planos conceptual y empírico son la validez, más específicamente la validez de
constructo previamente mencionada, y la fiabilidad. La validez supone medir lo que
realmente se pretende y la fiabilidad implica hacerlo con precisión, es decir sin
variaciones en los datos que aporta nuestro instrumento cuando no se suponen
variaciones en el plano conceptual y viceversa. Así por ejemplo, si se decidiese
registrar el número de palabras correctamente recordadas de un texto para estudiar la
creatividad de los sujetos, diríamos que el procedimiento elegido carece de validez.
Por su parte, si repitiendo en dos ocasiones una misma observación sobre la VD, ya
sea en momentos diferentes, con observadores diferentes..., obtuviésemos registros
dispares, diríamos que nuestro procedimiento no resulta fiable. Respecto a la medida
de la VD es necesario además que cuente con suficiente sensibilidad para registrar el
efecto de la VI, consiguiendo poner de manifiesto los cambios de comportamiento que
se producen en función de la misma. Así por ejemplo, si se pidiese a unos niños
pequeños responder a una tarea demasiado compleja para su edad diríamos que el
procedimiento no es sensible, ya que al resultar la tarea demasiado difícil, todos los
niños responderán mal independientemente del nivel de la VI recibido. Se daría así un
Mª Eva Trigo Sánchez 15
INTRODUCCIÓN AL DISEÑO DE INVESTIGACIONES

efecto suelo, con niveles de ejecución muy bajos independientemente del tratamiento
experimental recibido. De igual forma, si la tarea fuese demasiado fácil para todos los
sujetos, se obtendrían niveles de ejecución muy altos en cualquier caso, provocando
un efecto techo.

Referencias
Ato, M. y Vallejo, G. (2007). Diseños experimentales en Psicología. Madrid: Pirámide.
Gardner, R.C. (2003). Estadística para Psicología usando SPSS para Windows.
México: Prentice Hall. (Traducción del original en inglés, 2001)
Shadish, W., Cook, T.D. y Campbell, D.T. (2002). Experimental and quasi-
experimental designs for generalized causal inference. Boston, MA: Houghton
Mifflin Company.

También podría gustarte