Cuestionario Psicometría1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 26

CUESTIONARIO PSICOMETRÍA

¿Cuál es la problemática de la medición psicológica de acuerdo a Tornimbeni?

La medición es algo difícil por el comportamiento humano y los instrumentos que se utilizan en la
disciplina.

Analizando la historia y filosofía de la definición de medición en psicología se pueden distinguir 2


modelos fundamentales:

*Clásico Tienen diferentes perspectivas


*Representacional sobre el significado de “medición”

MODELO CLASICO:

Por medición se entiende la observación de propiedades cuantitativas tales como las frecuencias o
concentraciones.

Se postula que, para ser mesurable, esas propiedades deben poseer características de una variable
cuantitativa, y para que sea cuantitativa debe tener características como: distintividad, orden,
aditividad y proporcionalidad.

Las medidas derivadas son aquellas que para ser expresadas necesitan de otras medidas

La mayoría de escalas usadas en psicología son casi siempre derivadas (no poseen un cero absoluto)

Medir significa determinar efectivamente algunos de esos valores numéricos mediante el uso de
una escala. Y, cuando la medición es indirecta debe realizarse utilizando indicadores operacionales
adecuados es decir “propiedades observables legalmente ligadas a otras inobservables:

*concentración de noradrenalina en sangre → estrés (inobservable)

*movimiento rápido del ojo → sueño

Para Bunge y Ardila, el problema en psicología es que muchos constructos/conceptos teóricos no


son directamente observables y sus indicadores operacionales no han sido explicados claramente
por teorías científicas por ello, la medición no solo es indirecta, sino meramente empírica y ambigua.

Kline menciona que los test psicológicos no son instrumentos científicos como los que son usados
en las ciencias naturales debido a que no poseen un cero absoluto, no miden variables cuantitativas.

MODELO REPRESENTACIONAL: (admite diferentes niveles de medición)

Los números utilizados en la medición no representan cantidades sino relaciones.

Medir significa utilizar el sistema numérico para representar relaciones empíricas (asignar números)
aunque no exista isomorfismo entre ambos sistemas.

El sistema relacional empírico: hace referencia al conjunto de números y relaciones (objetos y


propiedades)

*Nominal: clasificación (1. Urbano-2. Rural)


Los números no representan más que una etiqueta, de tal forma que podríamos utilizar letras o
cualquier otro símbolo que difiera un grupo de otro.

*Ordinal: relación de orden (nivel educativo →primaria, secundario, terciario; nivel


socioeconómico →bajo, medio bajo, medio, medio alto, alto)

La escala ordinal incluye tanto la relación de equivalencia como la de orden (mayor que o más
grande que)

-No existen intervalos iguales.

-Sumas y restas no son admisibles

-Estadísticas que se admiten: mediana y correlación de rangos.

*Intervalos: escala intervalar (distancias numéricas que se corresponden con distancias


empíricas equivalentes en las variables que se desea medir.

*2 y 4
La distancia es la misma
*21 y 23

Las sumas y restas son legítimas, pero no así la multiplicación y división.

Ej: termómetro Fahrenheit

*cero relativo y arbitrario puesto que no indica la ausencia absoluta de calor*

Estadísticas permitidas: desviación estándar, la media y el coeficiente de correlación lineal son


admisibles en este nivel de medición.

*Razón: escala proporcional (permite realizar todas las operaciones matemáticas)

Existe un cero absoluto con significado empírico (el cero representa la ausencia absoluta de una
propiedad)

Posee todas las características de una escala de intervalo, pero además posee un cero absoluto o
natural en su origen.

Ej: peso

**EN PSICOLOGIA LOS RESULTADOS DE TESTS SON TRATADOS COMO DATOS DE UNA ESCALA DE
INTERVALO, AUNQUE PROVENGAN DE ESCALAS ORDINALES**

Estándar optimo,
MODELO CLÁSICO pero no alcanzable
en la actualidad

Una solución de
MODELO REPRESENTACIONAL compromiso más
factible actualmente
PSICOMETRIA Y TESTS PSICOLOGICOS

• Área fundamental de la psicología → PSICOMETRÍA → nace para la asignación de puestos


de trabajo

** el objetivo de hacer descripciones, clasificaciones, diagnósticos, explicaciones o predicciones que


permitan orientar una acción o tomar decisiones sobre el comportamiento de las personas en el
ejercicio profesional de la psicología**

**Es la ciencia que se encarga del estudio de la teoría y la técnica de la medición psicológica**

Incluye: evaluación y medición de diferentes características (conocimientos, aptitudes, destrezas,


habilidades, etc.)

Campo de actividad: construcción y validación de instrumentos de medición como son cuestionarios


y pruebas.

-PASOS PARA LA MEDICIÓN

*definición y descripción de criterio o atributo.

*Operacionalización: establecer procedimientos para medir. De que manera medimos el


atributo (decir como medimos)

*Establecimiento de unidades de medida o cantidad del atributo

DIAGRAMA DE COMPONENTES DE CRITERIO

DEFICIENCIA

CRITERIO
CONCEPTUAL Lo que yo quiero medir

Proporción que logré medir con


VALIDEZ RELEVANCIA
lo que yo usé para medir

CRITERIO REAL El instrumento que yo uso

CONTAMINACIÓN

Instrumentos que no son


útiles/miden otra cosa de la
que yo quiero medir
• Tests psicológicos se construyen para medir constructos que no pueden observarse
directamente.

RESEÑA HISTORICA

El empleo de los tests psicológicos se inicio en Europa a finales del siglo XIX.

Renacimiento-Ilustración → interés por aprendizaje y creatividad.

Darwinismo social → interés por diferencias individuales.

La década de 1950 es considerada como una fase “madura” de la teoría de los tests.

1960 → criticas (versiones computarizadas, respuesta al ítem → mas atractivos y realistas)

Presentación del test Wonderlic

-Mide inteligencia general/capacidad cognitiva (razonamiento verbal, numérico y lógico)

-Dura 12 min

-Para procesos de selección de personal. Se elaboraron baremos (tabla de medición) para distintas
profesiones.

-Prueba para adultos

APROXIMACION HACIA EL USO DE LAS PRUEBAS THORNDIKE

Tipos de decisión acerca de las personas:

Instruccionales: los profesores toman de ese tipo.

Curricular: se determina por medio de investigaciones (autoridades educativas)

Selección: que hacen las empresas o instituciones educativas (identificación de empleados


potencialmente más eficientes)

Ubicación o clasificación: para ubicar y clasificar se necesita información para predecir información
de cuanto aprenderá el individuo (medición de aptitudes, intereses o aprovechamiento)

Personales: opciones del individuo acerca de si mismos en múltiples encrucijadas de su vida


(medición de habilidades, intereses y temperamento)

El objetivo de los procedimientos de medición es proporcionar la información que permita tomar


estas decisiones de manera más apropiada.

¿Qué papel desempeña la medición en la toma de decisiones?

**Existen varios factores como: baja motivación, trastornos emocionales, escolaridad inadecuada,
antecedentes culturales (factores que influyen en una evaluación)

Los hechos reales deben ser tomados en cuenta, así como el sistema de valores.
Los procedimientos de evaluación no toman las decisiones, sino que son las personas quienes lo
hacen. Lo más que pueden hacer los procedimientos de medición es ofrecer información relevante
para tomar la decisión.

La función de la evaluación educativa y psicológica es sólo ofrecer información en cuanto a las


decisiones que podrían tomarse.

Decisiones que se relacionan con el entendimiento de la conducta humana requieren medidas de


estados innatos y de rasgos de los individuos.

La conducta es espontanea, no artificial.

La medición también es importante para proveer la información que guíe las decisiones teóricas.

La medición es fundamental para contestar prácticamente todas las preguntas que formula la
ciencia y no sólo las ciencias físicas, sino también las biológicas y las sociales.

¿Qué aspectos del individuo son relevantes para las decisiones?

El tipo de prueba de habilidad que describe lo que una persona ha aprendido a hacer se lIama prueba
de aprovechamiento.

Las pruebas que conciernen al dominio de habilidades tan definidas se suelen llamar pruebas
referidas al contenido o pruebas referidas al criterio, porque el enfoque se centra exclusivamente
en lograr un estándar de ejecución de una habilidad específica a la que se pretende medir por medio
de los ejercicios de una prueba.

prueba referida a la normal porque la norma para un desempeño aceptable se fija por medio de la
comparación con otro grupo. Una prueba referida a la norma se puede usar apropiadamente para
toma de decisiones en el curriculum de una profesión, en orientación vocacional y en investigación

Algunas decisiones que necesitamos tomar requieren tener información acerca de lo que una
persona puede aprender a hacer

Una prueba que se usa como predictor de alguna ejecución futura recibe el nombre de prueba de
aptitud.

Algunas decisiones requieren la información de lo que a una persona le gusta hacer. En estos casos
tratamos con la evaluación de intereses o de valores.

Finalmente, algunas decisiones, sobre todo aquellas que se relacionan con el entendimiento de la
conducta humana, requieren medidas de estados innatos y de rasgos de los individuos. Éstos son
los constructos, es decir, los atributos de los individuos que construimos expresamente para
ayudamos a explicar o teorizar acerca de su conducta. Expresiones como angustia, introversión,
dependencia de campo, autoritarismos y muchas otras

¿En qué situaciones se obtiene información de una persona?

¿De dónde proviene la evidencia por medio de la cual podemos evaluar las características de una
persona? Las fuentes. se dividen en dos tipos principales:

*situaciones naturales que ocurren en la vida cotidiana


*situaciones de "prueba" especialmente estructuradas

-A partir de las interacciones formamos impresiones de la persona observada, las cuales suelen ser
burdas y asistemáticas, pero están basadas en un amplio rango de situaciones de la vida diaria

La prueba de aprovechamiento o de aptitud de papel y lápiz es un tipo de situación específicamente


estructurada de mediciones psicológicas y educativas.

Los inventarios de autorreporte son especialmente importantes para evaluar intereses, actitudes,
valores y características del temperamento y ajuste emocional.

-Las situaciones de "prueba" artificiales no están limitadas a las que se presentan en un folleto de
pruebas en un salón de clases o en un lugar semejante. La prueba puede requerir que los individuos
demuestren poseer alguna habilidad, por ejemplo, mediante una prueba de mecanografía; también
se les puede poner en alguna situación interpersonal con una determinada tarea que se realice en
grupo; o bien se les puede proporcionar herramientas y un televisor descompuesto y pedirles que
localicen y corrijan la falla.

Tienen una función relevante para evaluar las habilidades de ejecución que son importantes tanto
en los aspectos educativos como en la vida misma.

¿Cuáles son los pasos esenciales en la medición?

En cualquier campo la medición siempre implica tres etapas:

a) Identificación y definición de la cualidad o el atributo que se va a medir.

b) Determinación del conjunto de operaciones por medio de las cuales se puede manifestar y
percibir ese atributo.

c) Establecimiento de un conjunto de procedimientos o definiciones para convertir las


observaciones en enunciados cuantitativos de grado y cantidad.

Comprender cada una de estas etapas y las dificultades que presentan permitirá contar con bases
sólidas para entender los procedimientos y problemas de la medición en la psicología y la educación.

¿Cómo se identifica y se define un atributo?

Nunca medimos una cosa o una persona. Las mediciones que hacemos siempre son de las cualidades
o los atributos de las cosas o personas; por ejemplo, medimos la longitud de una mesa, la
temperatura de un horno, la durabilidad de una llanta de automóvil, el sabor de un cigarrillo, la
inteligencia de un niño, la madurez emocional de un adolescente.

El segundo aspecto de la medición es encontrar o crear una serie de operaciones que aíslen el
atributo en el que se está interesado y que así se nos muestre con claridad

La definición de un atributo interactúa con las operaciones que lo provocan. Por un lado, la
definición que hemos fijado determina lo que aceptaremos como operaciones relevantes y
razonables. (definición de un atributo → definición operacional)

La tercera etapa consiste en expresar el resultado de esas operaciones en términos cuantitativos


*Atributos psicológicos no poseen unidades por lo que es necesario una definición*

-Pruebas de aprovechamiento: cuando la información obtenida es para un fin institucional o


educativo, nace la preocupación por la privacidad.

-Los derechos del individuo no son absolutos.

*Evaluación referida al criterio: no se compara con un grupo (es cuando alguien se le ocurre
establecer una variable estandarizada arbitraria)

*Evaluación referida a la norma: se compara con un grupo; acude a un promedio (medios


de tendencia central) Ej: ser bachiller

CUALIDADES:

**Las principales consideraciones para seleccionar a un instrumento de medición son:

-Validez → que el test mida lo que pretende medir

*Validez de contenido: es cuantitativa, tiene que ver con el dominio→ dimensiones


del constructo/posibles manifestaciones del constructo (medición de lo adecuado del muestreo)

*grado del instrumento refleja un dominio especifico de contenido de lo que se mide.

*Un dominio o campo conductual es una agrupación hipotética de todos los reactivos posibles que
cubren un área psicológica particular → se emplean términos de dominio, universo o población
conductual como sinónimos**

*Validez de constructo: se evalúe lo que estamos observando (correlaciones


positivas y negativas) (obtención de evidencias que apoyan que las conductas observadas en un test
son indicadores del constructo)

*el grado en que una medición se relaciona consistentemente con otras mediciones de acuerdo con
hipótesis y que conciernen a los conceptos.

*Validez de criterio: correlación entre la prueba y la realidad

-Validez concurrente: criterio que se fija en el presente

-Validez predictiva (evidencia externa): criterio que se fija en el futuro

*se establece la validez comparándolo con algún criterio externo. Criterio estándar con el que se
juzga la validez de un instrumento.

*Validez aparente: parezca que mide lo que pretende medir

-Fiabilidad → factores que se mantienen constantes (precisión con que el test mide lo que
mide); (test-retest: 2 veces el mismo test, método por mitades emparejadas: 1 sola vez y se califica
por separado ítems pares e impares)

*Consistencia interna: que los ítems vayan hacia la misma dirección

*Consistencia externa: repiten resultados a través del tiempo


-Utilidad practica → relación recursos y validez

-Jueces → determinan si los reactivos sometidos a su consideración pertenecen o no al


dominio definido, así como también si tienen una proporción adecuada.

**Necesito validez para que exista fiabilidad

**Puedo tener fiabilidad sin tener validez.

r→ coeficiente de correlación: relación entre 2 variables (abarca valores de 0 a 1)

r2→coeficiente de predeterminación: nos dice la proporción de una variable que podemos predecir
en base a otra. (sirve para saber cuánto yo puedo predecir)

**la confiabilidad se expresa a través de: 1) coeficiente de confiabilidad (valores de 0-1) mientras
más cerca de 1, más confiable será la prueba; 2) error estándar de medición (EEM)→ se estima el
intervalo probable de puntajes n el cual se encontrara el puntaje verdadero de un sujeto examinado
con un test psicometrico.**

**EL NIVEL DE CONFIANZA MAS USADO EN PSICOMETRIA ES EL DEL 95%**

**Existen 4 métodos básicos para obtener el coeficiente de confiabilidad: Método de las formas
equivalentes: 2 formas equivalentes o paralelas del test al mismo grupo de individuos. Método del
test-retest: aplica 2 veces el mismo test a una misma muestra de individuos. Método de la división
por mitades emparejadas: aplica el test 1 sola vez a una muestra, se califica por separado los ítems
pares e impares. Método de la equivalencia racional: considera que si un test esta formado por un
conjunto de ítems estos pueden ser considerados como un conjunto de tests paralelos.**

MÉTODOS EMPLEADOS PARA ESTIMAR LA VALIDEZ DE CONSTRUCCION

A) METODOS INTRAPRUEBAS:
Fuentes de evidencia mas usadas son: validez de contenido, análisis de los procesos
psicológicos empleados al responderla (ej: pidiendo que los sujetos razonen en voz alta sus
respuestas); también mediante el establecimiento de la homogeneidad a través del
coeficiente alfa de Cronbach o coeficientes de Kuder-Richardson (que contribuyen a evaluar
la unidimensionalidad del test)
B) METODOS INTERPRUEBAS:
Utiliza técnicas de análisis factorial, la validez congruente, los estudios de validez
convergente y divergente discriminante (propuestos por Campbell)
C) EL METODO DE LOS ESTUDIOS RELACIONADOS CON LOS CRITERIOS:
Implica la diferenciación de grupos y los coeficientes de validez.
D) EL METODO DE LA MANIPULACION EXPERIMENTAL:
Se manipula experimentalmente una variable y se observa sus efectos sobre los puntajes de
una prueba psicológica o la relacion de esos puntajes con algún criterio.
E) EL METODO DE LOS ESTUDIOS DE LA CAPACIDAD DE LA GENERALIZACION:
F) Analizan sistemáticamente la prueba psicológica en una amplia gama de dimensiones o en
condiciones diferentes de administración.
CLASIFICACIÓN GENERAL DE LOS TESTS DE ACUERDO A ALGUNOS CRITERIOS (MENESES,2014)

-Propósito: diferentes finalidades →selección, ubicación, diagnóstico y predicción

-Formato: test de respuesta escrita→las de manipulación y las de medidas fisiológicas

-Tipo de administración: se dividen en→individuales y grupales; verbales y no verbales

-Tratamiento de las personas: pruebas de ejecución máxima, pruebas de ejecución típica

-Estandarización: proceso mediante el cual se establecen procedimientos unívocos para la


aplicación, calificación e interpretación de un test psicométrico. Esta interpretación se realiza
comparando el puntaje obtenido por el sujeto con las puntuaciones contenidas en el baremo o
tablas de normas.

-Criterio: es cualquier desempeño que los sujetos tienen en la vida real, por ej: las medidas de
rendimiento académico, laboral, clasificaicones psiquiátricas, etc.

-Interpretación de las puntuaciones: interpretadas según la norma (en relación al


grupo→comparación con el grupo normativo) y los interpretados según el criterio (según un
indicador del mismo atributo a medir→estándar específico y arbitrario)

**se refiere al significado que se les da a los puntajes obtenidos por un grupo de sujetos,
estableciendo una clasificación de acuerdo a la conversión de sus puntajes directos en puntajes
percentiles, eneatipos (1-9) o decatipos (1-10)

¿Qué es un test psicométrico?

Es un procedimiento estandarizado compuesto por ítems seleccionados y organizados, concebidos


para provocar en el individuo ciertas reacciones registrables.

**es empleado como instrumento auxiliar para una mejor toma de decisiones: en la selección,
clasificación, diagnostico, investigación y evaluación de un determinado grupo de personas.

REQUISITOS DE UN TEST PSICOMETRICO

a) Contenido y dificultad de los ítems sistemáticamente controlados


b) Aplicación del test: ambiente en el que se aplica, material del test, administración bien
definida
c) Registro de comportamiento debe ser preciso y objetivo
d) Comportamiento registrado debe ser evaluado estadísticamente con respecto al grupo de
referencia o normativo.
e) Sujetos clasificados en función de normas resultantes
f) Respuestas a las cuestiones planteadas dan medida correcta del comportamiento al que el
test apunta (validez)
g) Si las condiciones no cambian, la repetición del examen debe conducir siempre al mismo
resultado (fiabilidad)

**La medición de un atributo psicológico realizada con un test psicométrico se denominan


puntajes o calificaciones directas→no poseen un significado preciso, adquieren un significado
psicométrico cuando se les compara con una tabla de normas o baremo.
Baremo →tabla que sistematiza las normas (afirmación estadística del desempeño del grupo
normativo en el test psicométrico) que transforman los puntajes directos en puntajes derivados
que son interpretables estadísticamente.

**Los tests se utilizan para medir atributos o características psicológicas del ser humano.

**primer test psicométrico fue la escala métrica de la inteligencia creada por Binet y Simon en 1905,
con la que se introdujo el concepto de edad mental.

TEST PSICOMETRICOS→ INTELIGENCIA: escala de Wechsler para adultos WAIS y niños WISC,
matrices de Raven; PERSONALIDAD: inventario multifásico de personalidad de Minnesota (MMPI),
16PF de Cattell, inventario de la personalidad de Eysenck.

LIMITACIONES DEL USO DE TESTS PSICOMETRICOS

1. No tiene validez universal, sino por la muestra.


2. Debe emplearse solamente para aquellos aspectos para los cuales se ha elaborado el
test.
3. No deben ser empleados para diagnosticar estados patológicos.
4. Se deben construir normas para los grupos en los cuales se usará el test.

TEORIA DE RESPUESTA AL ITEM (TRI)

Llamada también teoría del rasgo latente, es un modelo probabilístico que permite conocer la
información proporcionada por cada ítem, y así crear tests estandarizados, es decir, a medida.

En la medición psicológica y educativa encontramos problemas en relación con las tres etapas que
acabamos de describir. Primero, tenemos problemas para seleccionar y definir claramente los
atributos a los que debemos avocamos.

De las tres etapas que acabamos de considerar para el desarrollo de un procedimiento de medición
se deducen las principales cualidades de éste para ayudar a que la gente tome mejores decisiones:
proporcionar información relacionada con la decisión que se tome y proveer una información
precisa.

La evidencia es que el procedimiento de medición debe ser no sólo pertinente sino también exacto
y representativo.

TCT→Teoria clásica de los test:

esta teoría de los tests no está interesada en el sistema de relaciones empíricas, sino que centra su
atención en el análisis de las puntuaciones obtenidas para valorar los errores cometidos en el
proceso de medida indirecta de los fenómenos psicológicos. Es la llamada puntuación empírica (X),
que, de acuerdo con esta teoría, respondería a una relación lineal.

La TRI se propone cambiar el foco desde el tratamiento del test entero al tratamiento individual de
los ítems. Para hacerlo, esta teoría de los tests plantea la existencia de una relación entre las
puntuaciones en la variable latente –recordemos, de acuerdo con el modelo clásico de medida
psicométrica– y la probabilidad de acertar cada ítem introduciendo diferentes funciones
matemáticas para modelar adecuadamente esta relación.
Teoría clásica del test, asumen que las diferencias en las respuestas de los individuos a un test
determinado son debidas, única y exclusivamente, a la variación en la “capacidad” (actitud,
percepción, opinión, disposición, etc.) de aquellos.

teoría clásica define la dificultad de un item como “la proporción de individuos del grupo de interés
que responde correctamente al item”. Es decir, la mayor o menor dificultad de un item depende de
la capacidad de los individuos que están siendo medidos ( grupodependiente ) y, a la inversa, la
capacidad de los individuos depende de si los ítems utilizados en el test son fáciles o difíciles ( test-
dependiente )

Otro inconveniente de la teoría clásica del test es el relacionado con la fiabilidad del test. Según esta
teoría, la fiabilidad de un test hace referencia a la correlación entre los valores del test, cuando éste
es realizado varias veces de formas paralelas.

la teoría clásica del test gira en torno al test en su conjunto, y no en torno a cada item particular que
lo forma. Es decir, el valor alcanzado por el individuo en el test sólo permite valorar su capacidad
global ante dicho test, pero impide descender a un análisis individual de cada item. Por tanto, no es
posible, utilizando la teoría clásica del test, realizar predicciones sobre el comportamiento de los
individuos ante un item concreto o responder a la pregunta de cuál es la probabilidad de que un
individuo responda de forma correcta a un item determinado.

El modelo 1PL anteriormente presentado supone que todos los ítems discriminan de igual forma
entre individuos con distinta capacidad latente. Pero esta hipótesis es poco realista, ya que, en la
práctica, lo habitual es que la discriminación entre los individuos de reducida capacidad latente y
aquellos otros de elevada capacidad difiera de unos ítems a otros, lo que obliga a introducir en el
modelo 1PL un nuevo parámetro, conocido como parámetro de discriminación

El modelo 2PL (o modelo de Birnbaum).

¿Cuáles son los factores que afectan la validez?

- La variabilidad

si se aumenta la variabilidad de los datos, el coeficiente de correlación aumenta. Por esta razón, en
aquellos casos en los que exista una alta variabilidad en las puntuaciones del test, el coeficiente de
fiabilidad será mayor. De esto se desprende que un test no tiene un coeficiente de fiabilidad único
y fijo, sino que depende de las características de la muestra sobre la que se calcula

-Longitud:

Otro de los factores que afectan a la fiabilidad es la longitud del test. Así, la fiabilidad depende del
número de ítems que presente el test. La lógica de esta afirmación subyace en que cuantos más
ítems se utilicen para medir un constructo, mejor podrá ser valorado este y menor será el error de
medida que se cometerá al valorar la puntuación verdadera del sujeto.

-Características de los ítems


Cada ítem del test contribuye de manera específica a la fiabilidad o consistencia interna del test.
Una manera de comprobarlo es calcular el coeficiente alfa de Cronbach eliminando del cálculo la
puntuación del ítem. Si el ítem contribuye de manera positiva a la consistencia interna del test, al
eliminarlo del test, el valor del coeficiente alfa de Cronbach se verá alterado a la baja (si eliminamos
el ítem, el test pierde consistencia interna).

La restricción de rango: cuando su muestra ha sido pre seleccionada

-PERCENTILES: Los percentiles son una generalización de la mediana. La transformación basada en


los percentiles consiste en asignar a cada puntuación directa una puntuación porcentual, según la
posición de las observaciones dentro del conjunto de observaciones. Si el valor porcentual es del
25%, se estará hablando del percentil 25

- Para poder calcular los valores z, ubicados en la última columna de la tabla, es necesario conocer
la media y la desviación típica de la variable

LOS TESTS, ESCALAS, CUESTIONARIOS E INVENTARIOSARIAS MORENO

Para poder utilizar un test como instrumento científico de medición es necesario cubrir una serie de
etapas:

Una etapa inicial:

• la elaboración de una prueba piloto,

• su aplicación a una muestra de sujetos,

• la asignación de puntuaciones a los mismos.

Una segunda etapa:

• en la que se evaluaría la calidad psicométrica de cada uno de los ítems de la prueba piloto,

• la construcción definitiva del test.

Una tercera etapa:

• la aplicación del test a una muestra representativa de la población a la que va dirigido,

• se asignan las puntuaciones a los sujetos para su evaluación,

• estandarización de las puntuaciones y establecimiento de normas que permitan su interpretación,

• elaboración del manual del test.

El proceso de construcción de un test

A) La finalidad del test Pasos previos a la construcción del test:

• qué se quiere medir (variable objeto de estudio),

• a quién se quiere medir (población a la que va dirigido),

• para qué se quiere medir (uso o utilidad que se le va a dar al test).


B) La variable objeto de estudio

El problema surge cuando se quiere medir una variable psicológica, inobservable de forma
directa, un constructo. Los constructos se manifiestan a través de una serie de conductas, sí
observables de forma directa, y susceptibles de medición. Para que puedan ser consideradas
como manifestaciones del constructo han de ser más o menos uniformes y constantes a lo largo
del tiempo y en una serie de situaciones. Todas las cuestiones que hacen referencia a estas
conductas son las que deben ser reflejadas en los ítems del test.

C) Población a la que va dirigido el test No es lo mismo construir un test para evaluar algún rasgo
o característica en una población infantil que en una población de adultos.

D) Utilización prevista Para qué se va a utilizar, qué decisiones se van a tomar a partir de las
puntuaciones que obtengan los sujetos.

E) Especificación de las características del test Hay cuatro aspectos fundamentales a la hora de
desarrollar las especificaciones del test:

1. Contenido

a. La especificación comienza determinando cuál es su dominio de conductas. Si el constructo


no está claramente definido hay que seguir una serie de recomendaciones.

b. La definición del constructo y la determinación de su dominio de conductas no son procesos


distintos, sino que están fuertemente relacionados.

c. Se ha intentado hacer una categorización jerárquica, más o menos uniforme, de los distintos
procesos implicados.

2. Formato de los ítems: Hay dos grandes categorías: Los ÍTEMS DE ELECCIÓN (de respuesta
cerrada) y los ÍTEMS DE CONSTRUCCIÓN (el sujeto debe elaborar su propia respuesta).

a. Ítems de elección: Los formatos más comunes son:

1. DOS ALTERNATIVAS

o Se utiliza normalmente para medir variables de tipo cognitivo.

o Tiene la ventaja de ser rápido y fácil de usar.

o El inconveniente de respuestas al azar.

o No es el formato adecuado para los tests de personalidad, de actitudes, de intereses,……

2. ELECCIÓN MÚLTIPLE

o Se suelen utilizar de 3 a 5 alternativas.

o También se utiliza para medir variables cognitivas.

o No se utiliza para variables de personalidad, intereses, actitudes,…

o Tiene la ventaja de ser fácil de administrar, corregir y puntuar.


o El inconveniente de ser más difícil de construir que los de dos alternativas.

o El enunciado del ítem puede presentarse en forma:

a) interrogativa (la más directa y recomendable)

b) enunciativa (si el conjunto de ítems es coherente)

c) una frase truncada o incompleta (en tests educativos) o La forma de redactar las alternativas:

a) aquellos ítems que presentan una única respuesta correcta (cuando no hay ambigüedad),

b) aquellos ítems en los que todas las alternativas son parcialmente correctas (cuando se
evalúan procesos mentales complejos). o Las opciones de respuesta son independientes entre
sí.

3. EMPAREJAMIENTO

o Implica que el sujeto empareje los elementos de dos columnas, de acuerdo a las instrucciones
dadas en el enunciado.

o Para variables cognitivas.

5. FORMATO CLOZE O INCOMPLETO

o Se ofrece a los sujetos una frase incompleta y una lista de palabras.

o La tarea de los sujetos consiste en seleccionar la palabra adecuada a cada espacio en blanco.

o Para variables cognitivas.

5. ESCALAS DE CLASIFICACIÓN

Se presenta al sujeto un enunciado y distintas alternativas ordenadas de forma gradual a lo largo


de un continuo.

o El sujeto debe responder eligiendo la alternativa que mejor refleje su actitud personal.

o Se distingue de los ítems de elección múltiple en que, a diferencia de éstos, las opciones no
son independientes entre sí, sino interdependientes.

o Se utiliza para medir variables no cognitivas: actitudes, intereses, personalidad,……

o Ventaja: los sujetos expresan su postura de una manera más clara que en los ítems de elección
múltiple.

o Inconveniente: el significado de las distintas opciones no es el mismo para todos los sujetos;
es frecuente que aparezcan sesgos en las respuestas.

o No hay acuerdos generalizados acerca del número de opciones. El tipo de formato más
utilizado es el de 5 alternativas propuesto por LIKERT.

6. LISTADOS
o Los sujetos han de mostrar su opinión respecto a algún hecho. o No se utilizan para variables de
tipo cognitivo.

o Las opciones no están ordenadas, sino que son independientes entre sí. o No hay respuestas
correctas.

o El número de alternativas suele ser bastante grande.

o Es posible elegir varias opciones.

o Es un formato típico de los Cuestionarios.

b. Ítems de construcción: Es el propio sujeto el que ha de elaborar su respuesta, de ahí que


se denominen de respuesta abierta.

1. ITEMS DE RESPUESTA CORTA

o A veces no son más modificaciones de los ítems de elección múltiple (una palabra, una frase).

2. ITEMS DE RESPUESTA EXTENSA O DE ENSAYO

o Se pide a los sujetos que desarrollen un tema.

o Se utiliza para compensar la información parcial que proporcionan los formatos de respuesta
cerrada.

o Permite poner de manifiesto las habilidades cognitivas de orden superior.

o Se utiliza para todo tipo de variables (cognitivas y afectivas).

3. Longitud del test: ¿Cuál es el número de ítems adecuado?

Realmente no hay una respuesta única, ya que son varios los factores tener en cuenta:

• La población a la que va dirigido: no es lo mismo un test para niños que para adultos.

• El tiempo de que se dispone: a no ser que se desee medir la rapidez de respuesta, la longitud del
test debe ser tal que todos tengan tiempo suficiente para intentar resolver o contestar a todos los
ítems.

• Los objetivos del test: Depende si se quiere cubrir un área de conocimientos muy concreta o varias
áreas de contenido.

4. Características psicométricas de los ítems: Estas características aluden fundamentalmente a su


Nivel de Dificultad, a su Homogeneidad en relación a los demás ítems y a su Capacidad de
Discriminación.

F) Dificultad de los ítems Un ítem es fácil o difícil para una determinada población, en función de la
probabilidad que los sujetos tengan de responder a él correctamente. Se distinguen tres tipos de
tests:

1. TESTS DE VELOCIDAD:

o Los ítems deben ser muy fáciles de resolver.


o La dificultad estriba en que tienen un tiempo limitado de ejecución.

o Algunos tests para medir variables cognitivas lo son (tests de rapidez de cálculo).

2. TESTS DE EJECUCIÓN MÁXIMA:

o Utilizados fundamentalmente para la evaluación del rendimiento académico y para la medida de


aptitudes y destrezas.

o Los ítems presentan diferentes grados de dificultad.

o El tiempo no es un factor que deba influir.

3. TESTS DE EJECUCIÓN TÍPICA:

o Son los tests de personalidad, actitudes, intereses, etc,…

o Como no hay respuestas correctas, no tiene sentido hablar de dificultad de los ítems.

G) Los sesgos de respuesta

Los principales sesgos de respuestas, que hay que tratar de evitar en lo posible, son provocados por:

• Aquiescencia, o tendencia a responder sistemáticamente que se está de acuerdo (o en


desacuerdo) con el enunciado del ítem, con independencia de su contenido.

• Deseabilidad social, o tendencia a responder al ítem de una manera socialmente aceptable y no


en función de lo que uno sienta, opine o piense.

• Indecisión, o tendencia a seleccionar la etiqueta central o neutra (no sé, indiferente,…)

• Respuesta Extrema, o tendencia a elegir como respuesta las categorías de los extremos, con
independencia del contenido del ítem.

H) Revisión crítica por un grupo de expertos

Antes de dar forma a la prueba piloto, es conveniente que los ítems sean revisados por un grupo de
personas que no hayan intervenido en su elaboración (expertos, evitar la “deformación
profesional”,…) Una vez revisados, y eliminados los no indicados, se puede construir la versión
preliminar del test.

I) Confección de la prueba piloto

Son indicaciones de sentido común, que el alumno avezado de Psicometría ya ha puesto en


funcionamiento en varios exámenes, constituidos por ítems de elección múltiple o ítems de
construcción.

J) Aplicación de la prueba piloto

Una vez construida la prueba es necesario hacer un estudio piloto de la misma para su evaluación
psicométrica. Respecto a la forma de administración hay varias posibilidades (Colectiva-Individual,
Oral, Papel y lápiz, Mediante ordenador, Por correo).

K) Corrección de la prueba piloto y asignación de puntuaciones


Una vez que se ha aplicado la prueba piloto la primera tarea es valorar las respuestas dadas por los
sujetos a cada uno de los ítems para asignarles una puntuación. Existen distintos procedimientos,
dependiendo su elección del formato de los ítems.

CARACTERIZACIÓN DE LA EVALUACIÓN NORMATIVA Y DE LA EVALUACIÓN CRITERIAL (Heredia


Manrique)

La distinción entre evaluación normativa y evaluación criterial la hace Glaser en 1963, autor que
utiliza por primera vez la expresión «evaluación criterial» (Popham, 1983: 31). Estos dos tipos de
estrategias de evaluación hacen referencia explícita al rendimiento del alumno, cada una dando su
propia interpretación del mismo

-Evaluación normativa: tiene como objetivo ver la posición relativa de cada alumno respecto a los
demás y cumple su función cuando con ella se sabe quién es mejor (o peor) que quién. Así, trata de
identificar el talento del alumno, de manera que se puedan establecer comparaciones y luego hacer
una selección entre los alumnos

** Un test basado en pautas de normalidad está destinado a determinar la posición de un sujeto


examinado en relación con el rendimiento de un grupo de otros sujetos que haya hecho ese mismo
test**

-Trampa psicométrica: se realiza al construir el test normativo consiste en eliminar


los ítems relacionados con los contenidos más importantes de la enseñanza (justo lo
contrario de lo que hacen las pruebas criteriales) y, por tanto, los que más enseñan los
profesores y los que mejor son aprendidos por los alumnos, es decir, aparecen los ítems de
contenidos que no tienen la probabilidad de ser respondidos correctamente por la mayoría
de los alumnos, porque son los que pueden discriminarlos y diferenciarlos jerárquicamente,
que es de lo que se trata. Este tipo de trampa realizada indica claramente que lo importante
no es aprender, sino seleccionar con independencia de lo aprendido.

-Evaluación criterial:

La característica fundamental de esta evaluación es apreciar el logro de los objetivos por parte de
cada alumno sin compararlo con el de sus compañeros.

La evaluación criterial sería una forma de operativizar la evaluación del aprendizaje individual del
alumno respecto a objetivos educativos que actúan como criterio comparativo, y en términos
conductuales, oponiéndose a la comparación de aprendizajes entre alumnos.

La evaluación criterial tiene un amplio uso, no sólo con contenidos conceptuales, sino también con
contenidos procedimentales y, asimismo, en su extensión a ámbitos como la Educación Infantil

«Las pruebas criteriales permiten (...) comprobar el uso y aplicación de los conocimientos
procedimentales en diferentes situaciones particulares, a la vez que ofrecen unas pautas claras para
la observación de la calidad de su ejecución, grado de automatización, generalización a diferentes
contextos, grado de conocimiento sobre el procedimiento y grado de acierto en la elección del
procedimiento para solucionar una tarea»

ANALISIS FACTORIAL COMO TECNICA DE INVESTIGACION EN LA PSICOLOGIA (Pere Joan Ferrando)


En primer lugar, la mayor parte de los estudios factoriales en psicología utilizan el AF para evaluar
(a) la estructura de un test a partir de las puntuaciones en sus ítems, o (b) hipótesis de tipo
dimensional utilizando como medidas puntuaciones en diferentes tests.

En este artículo nos centraremos tan sólo en el modelo general más básico de AF: el modelo lineal,
basado en correlaciones, y que analiza medidas obtenidas en un solo grupo de sujetos y en una sola
ocasión.

**El AF es un modelo estadístico que representa las relaciones entre un conjunto de variables.
Plantea que estas relaciones pueden explicarse a partir de una serie de variables no observables
(latentes) denominadas factores, siendo el número de factores substancialmente menor que el de
variables**

En el AF se analiza un conjunto de variables observables (ítems, subtests o tests) cada una de las
cuales puede considerarse como un criterio. Así entendido, el AF consiste en un sistema de
ecuaciones de regresión.

MUESTRA En cualquier estudio factorial, y más aún en aquellos en que se desarrolla o adapta un
test, debe tenerse una idea relativamente clara de la población de interés. Por tanto, el AF debería
basarse una muestra representativa de esta población. Es muy habitual, sin embargo, utilizar
muestras de conveniencia (generalmente estudiantes universitarios).

Posiblemente, el problema más discutido en AF en relación a la muestra es el de la estabilidad de la


solución (¿Cuánta muestra se necesita para que una solución sea estable y generalizable?). Este es
un problema complejo. La estabilidad de una solución factorial depende conjuntamente de tres
factores: (a) el tamaño de muestra, (b) El grado de determinación de los factores y (c) la comunalidad
de las variables. De forma que, si los factores están bien determinados y las variables tienen poco
error de medida se podrán alcanzar soluciones estables con relativamente poca muestra.

Las medidas utilizadas habitualmente en psicología: tests y sobre todo ítems, contienen
intrínsecamente mucho error de medida. Habrá que aceptar pues que las comunalidades serán
generalmente bajas y, por tanto, se deberá actuar principalmente sobre los puntos (a) y (b). Con
respecto al punto (b), que se discute con detalle más abajo, la idea de determinación de un factor
refiere al número de variables que tienen pesos elevados en dicho factor.

VARIABLES El AF es un modelo para variables continuas e ilimitadas. Ni las puntuaciones de los ítems
ni las de los test lo son. Por tanto, en la mayor parte de las aplicaciones psicológicas el AF deberá
verse como un modelo aproximado cuya ventaja es la simplicidad. Es importante pues en primer
lugar discutir en qué condiciones la aproximación será lo bastante buena para lo que se requiere en
la práctica. El AF funciona generalmente bien cuando se analizan puntuaciones en tests y subtests.
En cuanto a los ítems, la aproximación suele ser también aceptable cuando se usan escalas de
respuesta graduada (Likert) con 5 o más categorías. Finalmente, los ítems binarios y los ítems con 3
opciones y una categoría central son potencialmente los que pueden presentar más problemas.

Sea cual sea el tipo de respuesta, que el AF funcione bien o no depende sobre todo de la distribución
de las puntuaciones. Las distribuciones simétricas no suelen dar problemas. Por otra parte los
problemas más importantes suceden cuando (a) las distribuciones son marcadamente asimétricas
y (b) las asimetrías van en ambas direcciones. Un ejemplo de esta situación sería el análisis de un
test que contiene ítems muy fáciles e ítems muy difíciles. Las asimetrías de signo contrario dan lugar
a relaciones no lineales y, por tanto, a la inadecuación del modelo AF lineal.

En el caso de tests y subtests el AF resulta casi siempre apropiado. En el caso de ítems de respuesta
graduada, el AF se espera que funcione bien si los coeficientes de asimetría están todos en el
intervalo entre -1 y +1.

Un estudio piloto convencional en el que se evalúen los índices de discriminación (correlaciones


ítem-total) o las correlaciones test-retest ítem a ítem es muy recomendable. Permite eliminar
aquellos ítems que sólo aportan ruido y empezar el AF desde un input más limpio.

Estos ítems se utilizan para evaluar la consistencia de los sujetos o (solapadamente) para
incrementar la consistencia interna del test. La presencia de ítems redundantes provoca siempre
problemas en el AF. En efecto, los errores entre dos ítems redundantes no pueden ser
independientes, ya que, aún después de eliminar los factores comunes, las respuestas siguen
estando relacionadas debido a la semejanza de contenidos. La consecuencia es la necesidad de
extraer factores adicionales definidos principalmente por parejas o tripletes de ítems redundantes.
Estos factores pueden ser difíciles de identificar, sobre todo en soluciones rotadas. Un análisis de
contenido previo puede eliminar redundancias y evitar estos problemas desde el principio.

s los marcadores son, teóricamente, medidas puras de un factor. En forma más aplicada, Cattell
(1988) las define como variables que, en estudios anteriores, han mostrado ser buenas medidas de
los factores que se están evaluando. Su uso tiene principalmente dos funciones: (a) permiten
identificar los factores aumentando su grado de determinación y (b) permiten relacionar los
resultados del estudio con estudios anteriores. Cattell (1988) recomienda utilizar como mínimo dos
marcadores por factor.

En cuanto a la relación entre el número de ítems y de factores, como sabemos, cuantos más ítems
existan que midan con precisión un factor, más determinado estará dicho factor y más estable será
la solución.

**La técnica estadística del análisis factorial nos servirá para el estudio de la contribución de los
diferentes ítems a un solo factor (estructura unidimensional) o a varios factores (estructura
multidimensional). La técnica del análisis factorial nos permitirá determinar k factores subyacentes,
a partir de una serie p de puntuaciones determinadas por los ítems iniciales del test. La idea es la
búsqueda de un modelo parsimonioso (simple) a partir de un conjunto complejo de datos. A partir
de los trabajos de Spearman a principios del siglo XX, y sobre todo de Thurstone en los años
cuarenta, el análisis factorial se evidencia como una buena herramienta en psicología para tratar de
identificar los factores que intervienen en la inteligencia. Thurstone propuso la utilización del
análisis factorial para dar explicación a las correlaciones que observaba entre diferentes ítems de
los tests de inteligencia. Así, el empleo de esta técnica le permitió la identificación y diferenciación
de las capacidades espacial, verbal y numérica, como factores de la inteligencia.**

LAS ETAPAS DE UN ANÁLISIS FACTORIAL

Análisis preliminares: adecuación de los datos De acuerdo con el planteamiento a doble nivel,
parece lógico que antes de emprender un AF se utilicen indicadores para evaluar si las correlaciones
obtenidas en el primer nivel son adecuadas para ser analizadas factorialmente en el segundo. Estos
indicadores suelen denominarse “medidas de adecuación muestral” y su uso es muy importante
como una etapa previa del AF: indicará si el AF es o no el modelo apropiado para los datos. Sin
embargo, esta es la etapa que más se pasa por alto en investigación aplicada.

Estimación del modelo: Como hemos avanzado antes, esta es la etapa crucial del AF. En ella se
estima una solución inicial y, sobre todo, se determina la dimensionalidad de los datos, es decir el
número de factores más apropiado. La etapa de estimación debe guiarse por el principio de
parsimonia. Se trata de determinar la solución más simple (es decir el menor número de factores)
compatible con residuales suficientemente cercanos a cero.

En esencia, el AF es un modelo basado en el principio de que las variables tienen error de medida,
distingue claramente entre varianza común (comunalidad) y varianza de error, y pretende
reproducir tan sólo la varianza común, que es la que interviene en las correlaciones entre las
variables. El ACP, en cambio, no hace esta distinción, sólo considera la varianza total y es esta
varianza total la que pretende reproducir.

Evaluación del ajuste: Para decidir si un modelo con m factores resulta apropiado, debe evaluarse
el grado de ajuste del modelo a los datos. Existen una variedad de criterios y procedimientos para
llevar a cabo esta evaluación.

El test de sedimentación (Scree-test; Cattell, 1988) es un procedimiento gráfico ampliamente


utilizado. En un gráfico bivariado, se representan puntos cuyas coordenadas son los valores propios
de la matriz de correlación original (es decir, las proporciones de varianza total explicada) en el eje
de ordenadas, y el número de componentes en el de abcisas. En una solución típica, el gráfico que
une los puntos es una función decreciente, similar en forma a la ladera de una colina de residuos. A
partir de cierto punto la función se hace prácticamente horizontal y es este punto el que, según
Cattell, indica el número más adecuado de factores.

TIPOS DE PRUEBAS

llamamos pruebas de ejecución máxima a aquellas que evalúan constructos que sí son escalables, y
que son aquellos en los que tiene sentido hablar de respuestas correctas y erróneas. Un examen,
un test de inteligencia o cualquier instrumento que mida aptitud sería clasificado dentro de este
epígrafe.

Denominamos pruebas de ejecución típica –o de ejecución de rasgos– a aquellas que miden


aspectos no escalables, o dicho de otra manera, a aquellas cuyas preguntas no tienen respuestas
correctas ni erróneas, sino que se trata de aspectos de opinión, de preferencia o similar.

Personalmente, preferimos los criterios de Moreno, Martínez y Muñiz (2004). Son menos (doce),
son mucho más claros y más fáciles de aplicar. Como podéis ver en la tabla 1, ahora los aspectos
que hay que valorar son tres: elección del contenido, su expresión y opciones de respuesta.
Ej de test ejecucion
típica
Una vez que sabemos la dificultad de un ítem, planteémonos, ¿cómo deberían ser las dificultades
de todos los ítems de una prueba? Como dice la directriz dos de Moreno, Martínez y Muñiz (2004),
la dificultad de un ítem debe relacionarse con la del concepto que recoge. Esto es, si un contenido
es fácil, el ítem debe ser fácil. Por tanto, una prueba que mide contenidos diversos debería tener
ítems de todas las dificultades, y éstas deberían corresponderse a la dificultad de los conceptos
medidos.
¿Es suficiente saber si un ítem es fácil o difícil para decidir si es adecuado o no? Intuitivamente,
podríamos pensar que sí, pero estaríamos equivocados. De hecho, si tuviéramos que destacar una
propiedad psicométrica de los ítems sobre el resto, esta sería la discriminación. Si un ítem no
discrimina, no es útil para la medición, y ese es el objetivo para el que fue redactado.

**entendemos como discriminación la capacidad de un ítem de distinguir entre las personas que
tienen un buen rendimiento en el test, respecto a las que lo tienen malo.**

CLASIFICACION DE CRONBACH

-TEST DE EJECUCION MAXIMA:

Test que examinan atributos psicológicos, pero exige al examinado respuestas correctas: Ej→
pruebas de inteligencia, aptitudes y habilidades (la persona tiene que esforzarse para darme una
respuesta correcta) → ESCALA WESCHLER (inteligencia en niños)

-TEST DE COMPORTAMIENTO TIPICO:

Tambien se examina atributo psicológico, pero no exigen respuestas correctas/incorrectas, sino da


cuenta del comportamiento habitual, de actitudes, motivación, personalidad: Ej→rasgos de
personalidad: intereses profesionales (las personas se conforman de una forma o de otra, no existe
respuesta incorrecta)→ MMPI

**AMBOS SON TEST ESTANDARIZADOS QUE EXAMINAN ATRIBUTOS PSICOLOGICOS**

¿Qué es un test?

Procedimiento por medio del cual seleccionamos una muestra de comportamiento de un dominio
y después evaluamos esa muestra usando un proceso estandarizado y los puntajes que obtenemos
nos permite hacer una inferencia sobre la magnitud ese constructo psicológico que queremos
evaluar.

CONFIABILIDAD

Normas recomendadas para la construcción y aplicación de un test: VALIDEZ Y CONFIABILIDAD

VALIDEZ VS CONFIABILIDAD

Validez: hace referencia en que medida el test mide lo que dice que mide.

**La validez es una propiedad de las puntuaciones y no del test.**

Confiabilidad: hace referencia al concepto de error, en que medida esa puntuacion que obtengo se
encuentra libre o seriamente afectada por factores de error.

Exactitud o precisión de una medida realizada a través de un test, no es una característica del test,
sino una propiedad de sus puntuaciones.

Error: hace referencia a cualquier factor que pueda afectar las puntuaciones de una prueba que no
se deban a un atributo psicológico que quiera medir.

ERRORES SISTEMATICOS O ALEATORIOS


-Al construir una prueba

-Al administrar una prueba

-Al interpretar la prueba

-Factores internos

Desde la Teoría Clásica de los Test, se sostiene que:

-cuanto mayor sea el error menos confiable son los resultados obtenidos por la prueba.

-error refiere a cualquier variación en las puntuaciones no debidas al rasgo evaluado.

DIMENSIONES DE LA CONFIABILIDAD: apunta evaluar, analizar algunas de estas fuentes típicas de


error.

-CONFIABILIDAD

Estabilidad:

Evalúa el grado en el que el puntaje de un individuo esta libre de errores de medición causados por
cambios personales aleatorios del examinado, o cambios en las condiciones de
administración→METODO→1. Test-Retest/2.Formas paralelas

Consistencia interna

Evalúa el grado en que distintas partes o ítems del test miden el mismo constructo o dominio. Indica
en qué medida la elección de la muestra de ítems que componen la prueba resulta una fuente de
error de medición→METODO→1.Particion de mitades/2.Covarianza de ítems (0.80 covarian
mucho)→los ítems miden lo mismo.

Acuerdo entre examinadores

Alude al grado en que la medición de un rasgo es independiente de la subjetividad del evaluador.


Se busca determinar si las puntuaciones obtenidas por un sujeto son independientes del
examinador→METODO→1.Coeficiente de Kappa/2.Correlacion Interclase.

-VALIDEZ

Estructura interna→para verificar estadísticamente si los ítems se agrupen tal como teóricamente
se había predicho se utiliza el Análisis Factorial.

Evaluar si las relaciones entre los ítems y/o dimensiones confirman la existencia de los constructos
que el test pretende medir.

Análisis factorial→este método multivariado permite agrupar las variables (ítems por ej) que se
correlacionan fuertemente entre sí, y cuyas correlaciones con las variables de otros agrupamientos
(factores) es menor.

Cada uno de estos factores agrupa a los ítems intecorrelacionados que son, al mismo tiempo,
relativamente independientes de los restantes conjuntos (factores) de ítems.
Evidencia externa→interesa predecir de manera precisa un determinado comportamiento o
desempeño a partir de las puntuaciones del test.

Métodos:

*Correlación bivariada con un criterio (concurrente o predictiva)→ concurrente: medir mi


prueba simultáneamente con el criterio que quiero medir, si noto que tengo una relacion en la
misma dirección→es una prueba de que la prueba mide lo que dice medir. →predictiva: predicción
a futuro

*Convergente-discriminante

*Grupos contrastados

ADAPTACION Y CONTRUCCION DE TEST PSICOMETRICOS

¿construir o adaptar una puerta? → tomar en cuenta el contexto sociocultural, los constructos
psicológicos se basan/acentúan en la cultura.

Una medición apropiada del constructo implica contemplar los aspectos éticos y émicos.

Éticos: aspectos o características universales (contentos→sonrisa/enojados→fruncidos)

Emico: aspectos propios y característicos de una cultura en particular.

-Sesgo de constructo: ocurre cuando el constructo no es idéntico en diferentes grupos


culturales (cuando el constructo es muy distinto de una cultura a otra)→émicos (más que adaptar
es construir un test)

-Sesgo de ítem: se genera cuando ciertos grupos culturales obtienen puntajes diferentes en
un ítem, a pesar de obtener un puntaje total similar. (la prueba pierde confiabilidad y validez)

-Sesgo metodológico: sucede cuando los estímulos, el lenguaje, la muestra y otras


características técnicas poseen un funcionamiento diferencial en una cultura u otra. (no afecta tanto
en el constructo sino el sistema estandarizado para puntuar los ítems)

CONSTRUIR:

1. Delimitación del dominio del test (especificar que es ansiedad, cuáles son las dimensiones
de la ansiedad, cual es la diferencia de ese constructo de otros)→modelo teórico
2. Redacción de los ítems→ que reflejen ese dominio
3. Revisión de expertos y prueba piloto
4. Análisis de las propiedades psicométricas (validez, confiabilidad, normas)
5. Elaboración de los materiales definitivos de la prueba (como se aplica, como se puntúa,
como se interpreta, etc.)

ADAPTAR:

Traducción de los ítems


Estudios de equivalencia (mostrar empíricamente que en términos semánticos y conceptuales son
los mismos)

Análisis de las propiedades psicométricas (validez, confiabilidad, normas)

Elaboración de los materiales definitivos de la prueba

También podría gustarte