Métodos para Estimar La Confiabilidad
Métodos para Estimar La Confiabilidad
Métodos para Estimar La Confiabilidad
Test-retest
El método Test- retest trata de comprobar la confiabilidad de una prueba utilizando el mismo
instrumento en dos momentos diferentes, aislados en el tiempo, por lo que al resultado obtenido
se le denominará como confiabilidad test – retest. La confiabilidad test – retest estima la
confiabilidad conseguida al correlacionar pares de puntuaciones obtenidas de las mismas personas
en dos aplicaciones distintas del mismo instrumento. Este método es recomendable usarlo,
cuando se está hablando de pruebas que pretenden medir aspectos aparentemente estables a lo
largo del tiempo, ya que si se midieran aspectos que suelen cambiar constantemente en una
persona, en la segunda aplicación se obtendrían resultados distintos y se llegaría a pensar que la
prueba no es confiable. Hay que tomar en cuenta que en este método, su principal fuente de
varianza puede ser el simple paso del tiempo, ya que se estima que entre más pase el tiempo, el
coeficiente de confiabilidad tenderá a ser menor, de hecho cuando el intervalo de tiempo entre la
aplicación de la prueba es mayor a seis meses, se le llega a llamar coeficiente de estabilidad.
Cuando las pruebas se administran en tiempos donde suceden cambios grandes en el desarrollo
de las variables que se pretenden medir con la prueba, el evaluador deberá no solo tomar en
cuenta la significación del coeficiente de confiabilidad, sino también los posibles factores que
podrían estar interviniendo en la aplicación y que por lo tanto alteran los resultados. Por todo lo
anterior, la estimación de la confiabilidad test-retest resulta ser más conveniente para medir la
confiabilidad de exámenes que ocupan como resultado el tiempo de reacción o juicios
perceptivos.
Como sabemos, las pruebas pueden tener formas distintas, para evaluar el grado de correlación se
puede optar por un coeficiente de confiabilidad de formas alternas o equivalentes, el cual recibe el
nombre de coeficiente de equivalencia, aunque antes que nada, hay que saber distinguir entre las
formas paralelas y las alternas. Se le conoce como formas paralelas cuando para cada forma de la
prueba sus medias y las varianzas de las puntuaciones de la prueba son iguales, por consiguiente
las medias de las puntuaciones que se obtienen en las formas paralelas, se correlacionarán igual
con las puntuaciones verdaderas, es decir, se correlación de igual manera con otras medias,
aunque el desarrollo de ellas puede consumir tiempo y ser costoso, aun así el usuario de la prueba
puede tener ventajas sobre todo en pruebas que miden rasgos relativamente estables. Por otro
lado, las formas alternas son aquellas versiones distintas que se construyeron con el propósito de
que fueran paralelas en cuanto al nivel de contenido y dificultad. Para obtener su confiabilidad en
ambos casos, se concuerda un poco con el método test- retest en dos aspectos, el primero es que
se requieren dos aplicaciones de la prueba y el segundo, es el hecho de que las puntuaciones
pueden ser afectadas por factores como la motivación, eventos que interfieren en lo personal,
inclusive el muestreo de reactivos. Se puede llegar a valorar la confiabilidad de una prueba sin
necesidad de elaborar una prueba alterna o tener que administrarla una segunda ocasión, dicha
forma es la estimación de la confiabilidad de la consistencia interna, en resumen es la estimación
de la consistencia entre los reactivos de la prueba.
Fórmula de Spearman-Brown
Donde:
Por otro lado, si se desea evaluar la confiabilidad de la prueba completa, se recurre a la fórmula:
Donde rhh es igual a la r de Pearson de las puntuaciones en las dos mitades de la prueba. La
confiabilidad ira en aumento conforme incrementa el largo de la prueba, por lo que al estimar la
confiabilidad basándonos en la prueba completa evidentemente será mayor, a comparación de
que si nos basáramos únicamente en la mitad. Además, la fórmula de Spearman – Brown es
funcional para los creadores y usuarios de las pruebas para valorar el efecto que tiene el acortar la
prueba, pues en ocasiones se requiere que se reduzca la prueba para que se aplique en una menor
cantidad de tiempo, también se puede ocupar la fórmula para decidir el número de reactivos
adecuados para conseguir el nivel deseado de confiabilidad, en estos casos, el añadir reactivos
podría aumentar la confiabilidad, siempre y cuando los nuevos reactivos tengan la misma
dificultad y contenido para que esta prueba alargada mida exactamente lo mismo que la original,
pero si la confiabilidad de la prueba original es baja, es poco probable que esta aumente al agregar
más reactivos. Este método no es recomendable al momento de estar evaluando la confiabilidad
de pruebas heterogéneas y pruebas de velocidad.
Frederic Kuder y M.W. Richardson no se sentían satisfechos por los métodos existentes en aquella
época, como por ejemplo el método de dividir en mitades para estimar la confiabilidad, por lo que
decidieron actuar y comenzaron a idear sus propios métodos para estimar su confiabilidad,
planteando diversas fórmulas, pero una de las más conocidas en las que colaboraron es la fórmula
20 Kuder – Richardson o simplificada como KR-20, la cual solo se usa en pruebas con reactivos
dicotómicos, sobre todo en aquellos cuya calificación solo es correcta o incorrecta. La fórmula es:
r_█(KR20 @ )=(k/(k-1))(1-pq/ϑ^2 )
Donde:
Algo peculiar que podemos observar con esta fórmula es que cuando los reactivos de la prueba
son muy homogéneos, nos encontraremos con que la KR – 20 y la estimación de confiabilidad de
dividir en mitades serán parecidos, mientras que si contamos con reactivos que son de carácter
heterogéneo, la KR – 20 brindará una estimación de confiabilidad inferior, a comparación de la
estimación de confiabilidad de dividir en mitades. Otra fórmula desarrollada por Kunder –
Richardson es la KR- 21, que es ocupada cuando se considera que todos los reactivos poseen
aproximadamente el mismo nivel de dificultad. Respecto a las fórmulas de Kuder – Richardson, en
los últimos años se han propuesto modificaciones para estas, aunque solamente hay una variante
para la KR – 20, debido a que la fórmula 20 ha sido la más aceptada y más usada en estadística hoy
en día, dicha variante se denomina coeficiente alfa.
Conocido comúnmente como coeficiente alfa, se considera la media de todas las correlaciones
posibles al dividir en mitades, es recomendable para utilizarse en reactivos no dicotómicos. Para
su cálculo se ocupa la siguiente fórmula:
r_α=(k/(k-1))(1- (ϑ_i^2)/ϑ^2 )
Donde:
k = Número de reactivos