Psicometría
Psicometría
Psicometría
• Teoría de los Tests, que incluiría lo relativo a cómo evaluar esas escalas y a cómo utilizarlas
para medir objetos o sujetos, es decir, la lógica y modelos matemáticos subyacentes a la
construcción y uso de los tests.
Pruebas y evaluación
Las raíces del surgimiento de las pruebas psicológicas datan de principios del siglo XX en Francia.
En 1905 Alfred Binet y un colega publicaron una prueba diseñada para asignar el grado escolar
apropiado para niños parisinos. Al paso de una década se utilizó una versión en inglés de la prueba
estructurada de Binet para escuelas de Estados Unidos.
Cuando Estados Unidos declaró la guerra a Alemania y participó en la primera guerra mundial en
1917, el ejército necesitaba una forma para evaluar rápidamente a grandes cantidades de reclutas
para descartar problemas intelectuales y emocionales. Las pruebas psicológicas esta metodología
necesaria para lograrlo.
Durante la segunda guerra mundial se desarrollaron y utilizaron un mayor número de pruebas que
pretendían medir una amplia gama de variables psicológicas.
Pruebas es el termino utilizado para referirse a todo lo relacionado con la aplicación de una
prueba (“como prueba en progreso”) y la interpretación de la puntuación y resultados obtenidos
de la misma (“las pruebas indicaron que..”).
Sin embargo, en la segunda guerra mundial, inicia el surgimiento de una distinción semántica
entre las pruebas y un termino mas inclusivo, evaluación.
El termino evaluación implica que las pruebas son solo un tipo de herramienta utilizada por
evaluadores profesionales y que la valoración de los resultados arrojados esta íntimamente ligada
al conocimiento, habilidad y experiencia del evaluador.
Como observaron Sundberg y Tyler (1962) “las pruebas son herramientas. En manos de alguien
torpeo de una persona sin escrúpulos, se convierten en perversiones pseudocientíficas”.
Maloney y Ward (1976) afirman que mas allá del uso de pruebas psicológicas por sí mismas
“literalmente cualquier método que pueda utilizar el examinador para hacer observaciones
relevantes es apropiado”.
Roberts y Magrab(1991) argumentaron que la evaluación no era una actividad que debía
confinarse a un consultorio. Para ellos, la evaluación implicaba menos énfasis en la medición y
cuantificación de los rasgos y mas énfasis en el entendimiento de problemas dentro del contexto
social. Para lograr ese entendimiento, la evaluación debe incluir observaciones de las actividades
diarias o dentro de los contextos ambientes en los cuales se desenvuelve el evaluado.
• Evaluación psicológica
Se define como la recolección e integración de datos relacionados con la psique individual con el
propósito de hacer una evaluación psicológica, concretada mediante el uso de herramientas como
pruebas, estudio de caso, observación conductual, así como equipos y procedimientos diseñados
específicamente para la medición de ésta.
También se puede definir como el proceso que consiste en identificar, rotular, seleccionar,
plantear objetivos, pronosticar y evaluar si los objetivos se alcanzaron; no se restringe solo al
diagnóstico, su finalidad es la toma de decisiones.
• Pruebas psicológicas
Se define como el proceso para medir variables relacionadas con la psique mediante instrumentos
o procedimientos diseñados para obtener rasgos de comportamiento definido como conducta.
• El proceso de evaluación
• un profesor,
• un psicólogo escolar,
• un consejero,
• un juez,
• un médico o
• "¿Este acusado es capaz de entender las implicaciones del juicio que se le sigue?" y
• El proceso de evaluación
El evaluador puede reunirse con la persona que será evaluada y/o con aquellas personas
relacionadas con el proceso de evaluación antes de la misma, con el fin de clarificar aspectos sobre
la razón o razones por las que fue referida.
Después viene la evaluación formal, durante la cual el evaluador empleará, por lo general, pruebas
y otras herramientas que le ayuden a responder las preguntas de referencia;
También pueden programarse más sesiones de retroalimentación personal con el evaluado o con
terceros involucrados (como los padres del evaluado o el profesional que refiere a la persona).
El objetivo principal del evaluador está en las puntuaciones de las pruebas, en los datos obtenidos
en las entrevistas e historia de desarrollo, así como otros datos disponibles derivados de la
evaluación formal.
Otra variedad de evaluaciones colaborativas puede incluir un elemento de terapia como parte del
proceso. Stephen Finn y sus colegas (Finn, 2003; Finn y Martin, 1977; Finn y Tonsager, 2002)
describieron la evaluación psicológica terapéutica como un enfoque que promueve un
autodescubrimiento terapéutico y lograr una mayor comprensión de determinados aspectos de la
conducta a través del proceso de evaluación
Un término cada vez más usado relacionado con las pruebas y la evaluación en las escuelas es
evaluación dinámica. La evaluación psicológica dinámica puede definirse como un modelo y
filosofía de una evaluación interactiva que implica diversos tipos de intervención del evaluador
durante el proceso de la evaluación.
Por ejemplo, un evaluador puede intervenir con sugerencias, retroalimentación o consejos mucho
más explícitos, no sólo para evaluar lo que ya sabe el evaluado, sino también para modificar de
manera efectiva y con ello cambiar la perspectiva de aproximación del evaluado hacia el problema
o tema por el cual es referido
• Evaluaciones alternativas
Esta sección establece que el Estado o la agencia educativa local "(i) debe desarrollar guías para la
participación de niños con capacidades diferentes en evaluaciones alternativas, haciendo hincapié
en aquellos niños que no pueden participar en programas de evaluación distritales y estatales; con
el fin de (ii) desarrollar y ... conducir las evaluaciones alternativas".
• La prueba
• La entrevista
• El portafolio
• Observación conductual
• Datos de historia de caso (“historia del desarrollo”, registros formales e informales, datos
y documentos importantes).
La prueba
Una prueba puede definirse tan sólo como un instrumento o procedimiento de medición. Cuando
la palabra prueba está acompañada por un modificador, se refiere a un instrumento o
procedimiento diseñado para medir una variable relacionada con ese modificador.
La forma de comportamiento puede variar desde las respuestas de un cuestionario por escrito,
respuestas orales a preguntas, hasta el desempeño de alguna tarea. La muestra del
comportamiento puede ser originada por el estímulo de la prueba misma o puede ser un
comportamiento que ocurre de manera natural (bajo observación).
Las pruebas difieren respecto a su calidad técnica. Cada vez es más común que se hagan
referencias a lo que se llama sondeo psicométrico de una prueba.
Y el sondeo psicométrico de una prueba es una referencia de qué tan consistente y precisa es la
medición de una prueba psicológica con respecto a lo que se propone medir.
La puntuación natural es el resultado más inmediato que se obtiene al calificar una prueba.
La puntuación normativa se obtiene comparando la puntuación natural del sujeto contra las
puntuaciones de individuos de grupo del que se obtuvieron las normas.
Las pruebas psicológicas y otras herramientas de evaluación pueden diferir en un gran número de
variables como contenido, formato (forma, plan, estructura, arreglo o disposición de reactivos de
la prueba), procedimientos de aplicación, puntuación, contextos de interpretación y calidad
técnica. El contenido (o los ternas) de la prueba, por supuesto, variarán de acuerdo al enfoque
teórico que la prueba maneje.
Pero aun cuando dos pruebas psicológicas tienen el propósito de medir lo mismo -por ejemplo, la
personalidad- pueden diferir de una manera amplia en los contenidos debido a factores corno la
definición de personalidad que el autor de la prueba maneje. así como el marco teórico de
referencia.
los desarrolladores y los editores, (los desarrolladores de las pruebas y los editores
crean pruebas y otros métodos de evaluación).
los usuarios y a
Los desarrolladores de las pruebas y los editores crean pruebas y otros métodos de evaluación.
Los Estándares para las pruebas psicológicas y educativas cubren aspectos relacionados con la
construcción y estandarización de pruebas, administración y usos, y aplicaciones especiales de las
pruebas, tales como adecuaciones especiales en la aplicación de pruebas a minorías lingüísticas.
Las pruebas son utilizadas por un amplio rango de profesionales, incluidos los profesionales
clínicos, los consejeros, el personal de recursos humanos, profesores y personal escolar.
Los Estándares, al igual que las guías y pautas de aplicación oficiales de varias organizaciones
profesionales, tienen mucho que impartir a los usuarios de las pruebas sobre el cómo, por qué y
bajo qué condiciones deben usarse las pruebas.
La prueba
Sin importar qué tan sólida sea una prueba, su propósito será fallido si el usuario falla en el
manejo y aplicación competente de todas las fases de las pruebas o del proceso de evaluación. Por
esta razón, el responsable de una prueba tiene obligaciones de carácter ético y estructural antes,
durante y después de la administración de la prueba. Las guías éticas dictan que antes de que una
prueba sea administrada, ésta debe guardarse de tal manera que se asegure de manera razonable
que los contenidos específicos no se harán saber por adelantado.
• Otra obligación del usuario antes de la administración de la prueba, es asegurarse de que
una persona capacitada y preparada realice la aplicación de manera adecuada.
• Deben evitarse hasta donde sea posible, condiciones de distracción como ruido excesivo,
calor, frío, interrupciones, luz del Sol en exceso, sobrepoblación o ventilación inadecuada
El evaluado
■ El estado de ansiedad que están experimentando y el grado en que la ansiedad puede afectar de
manera significativa los resultados de la prueba.
■ El grado de incomodidad física por no haber comido lo suficiente, haber comido en exceso u
otras condiciones físicas.
■ El grado en que son, por falta de un término mejor, "afortunados" y pueden "acertar" en una
prueba de opción múltiple (aun cuando quizá no hayan aprendido el tema en cuestión).
En el sentido más amplio en el que se ha utilizado el término "evaluado", cualquier persona que
sea sujeto de una evaluación o prueba puede ocupar el papel de evaluado. Una autopsia
psicológica puede definirse como una reconstrucción del perfil psicológico del individuo fallecido
con base en registros de archivos, artefactos y entrevistas conducidas con anterioridad con el
evaluado o con gente que lo conoció.
¿En qué tipos de escenarios se conducen las evaluaciones y por qué?
• Escenarios educativos
• Además de las pruebas de habilidad escolar, ahora usted se familiarizará con las
pruebas de logro: evaluaciones de los conocimientos adquiridos o el grado de
aprendizaje que ha tomado lugar.
• Escenarios geriátricos
• Sin importar dónde residan los individuos mayores, en algún momento requerirán
de una evaluación psicológica que establezca el funcionamiento cognitivo,
psicológico, adaptativo y algún otro, relacionado con su desempeño general.
• Escenarios clínicos
• En los negocios, así como en el ejército, a las pruebas psicológicas se les conceden
diversos usos, tal vez de manera más notable es aquel para la toma de decisiones
sobre las carreras del personal.
• Catálogos de pruebas
• Manuales de pruebas
• Volúmenes de referencia
• Otras fuentes
• Catálogos de pruebas
• Quizá una de las fuentes de información más accesible sobre una prueba sea un
catálogo distribuido por el editor de la prueba.
• Manuales de pruebas
• Volúmenes de referencia
• El Instituto Buros de Mediciones Mentales ofrece una "tienda rápida" con una
gran cantidad de información relacionada con las pruebas. La versión inicial de lo
que evolucionaría en el Anuario de mediciones mentales (AMM) fue recopilado
por Osear Buros en 1933.
• PsycARTICLES es una base de datos de artículos con una amplia extensión que
datan desde 1988.
• Otras fuentes
• Las bibliotecas escolares contienen un gran número de otras fuentes que pueden
utilizarse para adquirir información sobre pruebas y temas relacionados con ellas.
Consideraciones históricas, culturales y ético/legales
1869
Sir Francis Galton, primo segundo de Charles Darwin, publica un estudio sobre la herencia y el
genio, siendo pionero en la técnica estadística que Karl Pearson luego llamaría correlación. Luego,
Galton hace numerosas contribuciones a la medición a través de varios inventos e innovaciones.
En el curso de sus esfuerzos por explorar y cuantificar las diferencias individuales entre personas,
Galton contribuyó ampliamente en el campo de la medición
1879
Wilhelm Max Wundt funda el primer laboratorio experimental de psicología, en Leipzig, Alemania.
El acontecimiento fue memorable porque a partir de entonces la psicología es tratada como
ciencia y no como una rama de la filosofía. Wundt, un estructuralista, confía en una herramienta
de evaluación llamada introspección, en la cual los sujetos tratan de describir fielmente su
experiencia consciente de un estímulo.
1890
El psicólogo norteamericano James McKeen Cattell acuña el término prueba mental en una
publicación. Cattell estudió con Wundt en Leipzig y fue inspirado por Galton en Cambridge.
1905
Alfred Binet y Theodore Simon publican una "escala de medición de la inteligencia" con 30
reactivos, diseñada para ayudar a identificar a los niños escolares con retraso mental en la ciudad
de París. La idea de la medición de la inteligencia es de gran atractivo mundial, y la prueba Binet-
Simon inicia la nueva era en la medición.
El siglo XX
La medición de la inteligencia
1939, David Wechsler, un psicólogo clínico del Hospital Bellevue en la ciudad de Nueva York,
introdujo una prueba diseñada para medir la inteligencia de los adultos, definida como "la
capacidad agregada o global del individuo para actuar en forma propositiva, para pensar en forma
racional y para enfrentarse en forma efectiva con su ambiente La prueba, originalmente llamada
Escala de inteligencia Wechsler-Bellevue, fue revisada y se le cambió el nombre a Escala Wechsler
de inteligencia para adultos (Wechsler Adult Intelligence Scale; WAIS).
La medición de la personalidad
Después de la guerra, Woodworth elaboró una prueba de personalidad para uso civil basada en la
Hoja de Datos Personales y la llamó Inventario psiconeurótico de Woodworth (Woodworth
Psychoneurotic Inventory). Este inventario fue la primera prueba de personalidad basada en un
informe personal, usada en forma extensa, un método de evaluación que pronto sería empleado
de diversas formas en sucesivas pruebas de personalidad.
Hubo varios métodos que cubrieron la necesidad de medir la personalidad, sin basarse en el
informe personal. Uno de esos métodos o enfoques para evaluar la personalidad se describió
como de naturaleza proyectiva. La prueba proyectiva es aquella en la que se asume que un
individuo "proyecta" en algún estímulo ambiguo sus propias e individuales necesidades, temores,
esperanzas y motivaciones .
El estímulo ambiguo podría ser una mancha de tinta, un dibujo, una fotografía o alguna otra cosa.
Quizá la prueba proyectiva más conocida es el Rorschach, una serie de manchas de tinta,
elaborada por el psiquiatra suizo Hermann Rorschach.
Un repaso de estadística
• Escalas de medición
Las reglas usadas al asignar números son lineamientos para representar la magnitud ( o alguna
otra característica) del objeto que se mide. Un ejemplo de una regla de medición es asignar el
número 30 a todas las longitudes que tienen exactamente el mismo largo que una regla de 30
centímetros.
Una escala es un conjunto de números (u otros símbolos) cuyas propiedades modelan propiedades
empíricas de los objetos a los que se asignan los números. Existen varios tipos de escalas. Hay
cuatro niveles diferentes o escalas de medición.
nominal
ordinal
intervalo
razón
• Escalas nominales
Las escalas nominales son la forma más simple (elemental) de medición. Estas escalas implican la
clasificación (agrupación)o asignación de categorías basada en una o más características distintivas
donde deben colocarse todos los objetos medidos en categorías (clases) mutuamente excluyentes
y exhaustivas.
Las operaciones aritméticas que se pueden realizar en forma legitima con datos nominales
incluyen contar con el propósito de determinar cuántos casos caen en cada categoría y alguna
determinación consecuente de proporción o porcentajes.
Ejemplo: En el DSM cada trastorno enumerado en el manual se le asigna un número (el número
104.00 designa el trastornos de depresión mayor)
• Escalas ordinales
Al igual que las escalas nominales, las escalas ordinales permiten la clasificación.
Sin embargo, además de la clasificación, con las escalas ordinales también es permisible un
ordenamiento por rangos con base en alguna característica.
Ejemplo: pacientes (individuos) son comparados con otros y se les asigna un rango – 1 para lista de
espera más necesitado, 2 para el siguiente, etc.
• Escalas de intervalo
Además de las características de las escalas nominales y ordinales, las escalas de intervalo
contienen intervalos iguales entre números; cada unidad en la escala es exactamente igual a
cualquier otra unidad en la escala.
Las escalas de intervalo al igual que las ordinales no contienen cero absoluto (es arbitrario).
Ningún evaluado posee cero capacidad o cualidad (o cualquier característica que se mida). Indica
la magnitud del atributo que se quiere medir. Ejemplo: la diferencia entre el CI de 80 y uno de 100,
se considera parecida a la existente entre los CI de 100 y 120.
• Escalas de razón
Además de tener las mismas propiedades de las escalas nominales, ordinales y de intervalo, la
escala de razón tiene un punto cero verdadero.
• Una puntuación cruda es una cuantificación directa del desempeño, sin modificaciones,
usualmente numérica. Puede reflejar una simple cuenta, como el numero de reactivos
respondidos en forma correcta en una prueba de resultados.
Distribuciones de frecuencia
Distribuciones de frecuencia
• el histograma
• La gráfica de barras y
• El polígono de frecuencia
Una medida de tendencia central es un estadístico que indica el promedio o el punto medio entre
las puntuaciones extremas de una distribución.
• Media
• Mediana
• Moda
Media
• Denotada por el símbolo X (que se denota "media") la media aritmética es igual a la suma
de las observaciones ( o a las puntuaciones de prueba en este caso) dividida entre el
número de observaciones.
• Por lo general, la media aritmética es la medida más apropiada de tendencia central para
datos de intervalo o razón cuando se cree que las distribuciones son cercanas a la normal.
Mediana
• Dentro de una distribución de puntuaciones, aquella puntuación que se repite con mayor
frecuencia es conocida como moda.
Medidas de variabilidad
Desviación estándar
• La desviación estándar se puede definir como una medida de variabilidad igual a la raiz
cuadrada del promedio de las desviaciones cuadradas con respecto a la media. De manera
más sucinta, es igual a la raíz cuadrada de la varianza. La varianza es igual a la media
aritmética de los cuadrados de las diferencias entre las puntuaciones en una distribución y
su media.
Curva normal
La curva normal es la distribución de datos por excelencia también conocida como curva de
campana, uniforme, definida en forma matemática con su máxima altura en el centro.
A partir del centro disminuye en forma gradual hacia ambos lados aproximándose al eje X de
manera asintótica (lo que significa que se acerca al eje, pero nunca lo toca). En teoría, la
distribución de la curva normal va desde el infinito negativo hasta el infinito positivo. La curva es
perfectamente simétrica, sin sesgo, de modo que si se dobla a la mitad en la media, un lado
quedaría en forma exacta encima del otro. Debido a que es simétrica, la media, la mediana y la
moda tienen el mismo valor exacto.
• Rango
El rango de una distribución es igual a la diferencia entre las puntuaciones mayor y menor.
• Puntuación Z
Una puntuación z, resulta de la conversión de una puntuación cruda en un número que indique a
cuantas unidades de desviación estándar esta la puntuación cruda por debajo o por encima de la
media de la distribución.
Se usa para trazar la curva normal en términos de área bajo la curva.
• Estandarización
Clasificación de normas:
• Normas nacionales
• Normas internacionales
• Normas locales
• Entre otros.
• Percentil