Medir y Evaluar Issue PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 102

ISSN 2539-3677

MEDIR Y EVALUAR

Nº 1
Apoyan
Facultad de Ciencias Humanas
Dirección de Bienestar
Programa Gestión de Proyectos
Sede Bogotá
Medir y E va l u a r
Volumen 1 / Numero 1 / ISSN 2539-3677
Universidad Nacional de Colombia
Facultad de Ciencias Humanas
Sede Bogotá

El grupo estudiantil Revista “Medir y Evaluar” nace en Rector


el Laboratorio de Psicometría del Departamento de Ignacio Mantilla Prada
Psicología, con el propósito de fomentar la publicación de Vicerrector
artículos de carácter cualitativo, cuantitativo o mixto en Jaime Franky Rodríguez
medición y evaluación en psicología y áreas afines, reali- Director Bienestar Sede Bogotá
zados por estudiantes de pregrado y postgrado adscritos Oscar Oliveros
a universidades nacionales y extranjeras. Coordinadora Programa Gestión de Proyectos
Elizabeth Moreno
Decana de la Facultad de Ciencias Humanas
Contacto MEDIR Y EVALUAR Luz Amparo Fajardo Uribe
[email protected] Director Bienestar Ciencias Humanas
/Labpsicometria Eduardo Aguirre Dávila
http://www.humanas.unal.edu.co/psicometria/

Edición
Universidad Nacional de Colombia Jazmine Escobar Pérez
Cra 45 No 26-85 Ana Cristina Santana Espitia
Edificio Uriel Gutiérrez Coordinador 3

Sede Bogotá William Ricardo Novoa Navarro


www.unal.edu.co Comité Editorial
Jhon Alejandro Salgado Ortiz
Luisa Fernanda Castañeda Ballesteros
Contacto PGP Juan Daniel Barragán Fuentes
[email protected] Camilo Andrés Bonilla Hernández
[email protected] Ilustración portada
ugp.unal.edu.co María Camila Contreras
/gestiondeproyectosUN Corrección de Estilo
issuu.com/gestiondeproyectos Diana C. Luque V.
Diseño y Diagramación
Nicole Angie Calderon Castaneda (PGP)
Los textos presentados en la siguiente Impresión
publicación expresan la opinión de sus GRACOM Gráficas Comerciales
respectivos autores y la Universidad Nacional no
se compromete directamente con la opinión Derechos de Autor y Licencia de distribución.
que estos pueden suscitar. Atribución – No comercial - Sin Derivar.
Editorial 6
A RTÍCU LOS
Recuperación de la información en
la memoria de corto plazo: lectura 10
silenciosa versus lectura en voz alta

Proceso de evaluación psicológica


a un niño de quién se sospecha 22
habilidades cognitivas superiores

La influencia de francis galton en la


consolidación de la psicología como 40
disciplina científica

4 Estudio experimental de la relación


entre la valencia y el recobro
de imágenes en un grupo de 52
MEDIR Y EVALUAR

estudiantes universitarios
E N S AYO S
Discusiones actuales sobre el uso de
instrumentos de medición psicológica 66
en procesos de evaluación

La ética y los números 76


D I DÁCTICA
G*power 3: software para el análisis
de la potencia estadística 84
S OF TWA R E
Programa de análisis cualitativo o QDA
(qualitative data analysis) en inglés 96
C O N T E N I D O

5
E D I T O R I A L

P ublicar es iniciar un diálogo con otros, quienes

Ana Cristina Santana Espitia


pueden estar a una gran distancia, o, incluso, en otro

y Jazmine Escobar Pérez


tiempo; es plantear una idea y esperar la interlocución
del otro; es mostrar lo que se encontró en un estudio
y sembrar nuevas preguntas en la comunidad acadé-
mica. Publicar, también, es estar dispuestos a recibir
6 retroalimentación de esa investigación o postura, para

Editoras
enriquecerla con otras miradas. Publicar es un ejercicio
básico en la comunidad científica, así como el espacio
MEDIR Y EVALUAR

fundamental para la divulgación de sus procesos inves-


tigativos. Es por esto que la investigación formativa debería culminar
con ejercicios de publicación, ya que tanto la investigación como la
publicación se aprenden en la práctica. Para ello, es necesario contar
con espacios en los que los estudiantes de pregrado
y postgrado puedan publicar los trabajos que surgen
de sus asignaturas y de sus experiencias investigati-
vas iniciales, las cuales, paulatinamente, configura-
rán su trayectoria como investigadores.
Es un motivo de gran satisfacción presentar a
la comunidad académica el primer número de la
Revista Medir y Evaluar. Esta publicación, fruto del
grupo estudiantil Medir y Evaluar, del Laboratorio de
Psicometría de la Universidad Nacional de Colombia,
busca dar respuesta a la necesidad presentada en
el párrafo anterior, fomentando la publicación de trabajos e inves-
tigaciones en medición y evaluación en psicología y áreas afines,
realizados por estudiantes de pregrado y postgrado adscritos a
universidades nacionales y extranjeras.
La revista, con sus diferentes secciones, representa un espacio
para compartir los hallazgos, reflexiones y aprendizajes de los estu-
diantes en un contexto de investigación formativa. La sección Artículos
recoge tanto trabajos teóricos, como estudios empíricos y estudios de
caso. La sección de Ensayos tiene como propósito ofrecer un análisis
del autor en torno a una situación problemática o coyuntural presente en psicometría,
medición o evaluación. La sección de Medición y Tecnología cuenta con escritos que se
centran en la descripción de software relacionado con la psicometría y los métodos de
investigación. La sección Didáctica se enfoca en el aprendizaje y la enseñanza de con-
ceptos, métodos y procedimientos usados en la investigación, la
evaluación psicológica y la psicometría. De esta manera, la revista
Medir y Evaluar brinda espacios para diferentes etapas y aspectos
del proceso investigativo.
Queremos expresar nuestro agradecimiento a los estudian- 7
tes de pregrado y postgrado, quienes hacen parte del grupo y
han contribuido con el nacimiento de este proyecto estudiantil;
además de los miembros de los comités editorial y científico, sin
cuya invaluable colaboración esta revista no sería posible. Agra-
decemos de manera muy especial a la docente Aura Nidia Herre-
ra, directora del Laboratorio de Psicometría y de la revista Avan-
ces en Medición, quien nos ha alentado a emprender esta tarea,
pues, de hecho, la revista Medir y Evaluar nace como una “hijita”
dirigida al ámbito estudiantil de la revista Avances en Medición.
Asimismo, agradecemos el apoyo institucional recibido a través
de la Dirección de Bienestar – Programa Gestión de Proyectos y
la Vicedecanatura de Bienestar Universitario de la Facultad de
Ciencias Humanas, quienes también son responsables de este
logro. Finalmente, extendemos una cordial invitación a la comu-
nidad universitaria a participar con sus aportes en la medición y
evaluación, aspectos que, sin lugar a dudas, enriquecen el desa-
rrollo de la investigación en diferentes áreas.
Recuperación de la información en
la memoria de corto plazo: lectura
silenciosa versus lectura en voz alta
8

Proceso de evaluación psicológica


MEDIR Y EVALUAR

a un niño de quién se sospecha


habilidades cognitivas superiores

La influencia de francis galton en la


consolidación de la psicología como
disciplina científica

Estudio experimental de la relación


entre la valencia y el recobro
de imágenes en un grupo de
estudiantes universitarios
A R T Í C U L O S

9
RECUPERACIÓN DE LA
INFORMACIÓN EN LA
MEMORIA DE CORTO PLAZO:
LECTURA SILENCIOSA VERSUS
L E C T U R A E N V O Z A LTA

Recovering of the short-term


memory information: Silent
reading vs. loud reading

R esu m en
10
El objetivo del presente artículo es presentar tras 30 segundos. Como método
los resultados de la investigación cuantitativa, rea- de análisis estadístico se utilizó
MEDIR Y EVALUAR

lizada a fin de explorar la efectividad de la lectura la prueba U de Mann-Whitney.


en voz alta o mentalmente para el proceso de me- El resultado de este análisis no
moria. Como método se utilizó un muestreo de tipo mostró diferencias significativas
aleatorio simple en población específica, conforma- al comparar los resultados de
da por 30 estudiantes de la Universidad Nacional de ambos grupos, por lo que se lle-
Colombia, correspondientes a su sede en la ciudad gó a la conclusión de que aunque
de Bogotá-Colombia, repartidos en dos grupos. A no se encontraron diferencias,
estos se les pidió leer en voz alta o mentalmente, estos resultados podrían servir
intentando memorizar una lista de 15 palabras como piloto para una prueba con
para identificar cuántas de ellas lograban recordar mayor muestra.

Palabras clave:
memoria a corto plazo, lectura
mental, lectura en voz alta,
investigación cuantitativa
Santiago Gil Bossa / [email protected]
Laura Ximena Restrepo Aristizabal / [email protected]
Daniel Santiago Patarroyo Guillen / [email protected]
Estudiantes de Psicología
Universidad Nacional de Colombia, sede Bogotá

A b stract
11
The objective of this work is present the results them were able to recall after 30
of quantitative research carried out, performed in seconds. As a method of statisti-
order to explore the effectiveness of reading aloud cal analysis we used the statisti-
or mentally for the memory process. As method cal test U Mann-Whitney; the re-
was used the sample obtained by sampling simple sult of this analysis not found sig-
random type in specific population consisted for nificant differences when com-
30 students of the National University of Colombia paring the results of both groups;
corresponding to their headquarters in Bogotá-Co- so it is concluded that, although
lombia divided in two groups. Those groups were no differences were found, these
asked to read aloud or mentally, trying to memorize results could serve as a test pilot
a list of 15 words in order to identify how many of for a bigger sample.

Keywords:
short-term memory, mental
reading, reading aloud,
quantitative research.
L a memoria constituye la capacidad de codificar y almacenar in-
formación o experiencias vividas; por tanto, es fundamental para el
aprendizaje y pensamiento humano; a su vez, existe el proceso de evo-
cación, definido como la capacidad de recuperar información almace-
nada; este, normalmente, no es fácil pero se puede hacer uso de mne-
motécnicas o la relación entre dos campos diferentes de la memoria.

Memoria
Es la capacidad de retener y recuperar información y experiencias
vividas por medio de procesos neurobiológicos; esta capacidad es fun-
damental para el aprendizaje y pensamiento, y está integrada por tres
procesos básicos que son: codificación, proceso inicial para que la infor-
mación sea almacenada en la memoria donde las experiencias vividas
son codificadas en constructos para su posterior almacenamiento; el
cual consiste en la creación de registros permanentes o la categoriza-
ción de la información; este es un proceso relativamente flexible, que
presenta cambios a lo largo de la vida; por último, la recuperación, con-
siste en la evocación del registro o categoría almacenada (Etchepare-
borda & Abad-Mas, 2005). La información almacenada se ve afectada
por la manera en la que fue guardada y por el paso del tiempo.
La memoria está dividida en dos grandes tipos: por un lado, la senso-
rial, donde son almacenados recuerdos o experiencias que son percibidos
por los sentidos; este tipo de memoria, a su vez, estaría subdividido en: la
memoria gustativa, sensorial, auditiva, visual, táctil y olfativa. Por otro lado,
está la memoria en relación con el tiempo, la cual está concedida a través
12 de una variable temporal y se encuentra dividida en: memoria de corto pla-
zo (MCP), memoria de largo plazo (MLP) y memoria inmediata (MI).
MEDIR Y EVALUAR

Memoria d e c o rto p l a zo (MCP)


La memoria de corto plazo (MCP) es la capacidad de retención de
información, presentada recientemente por breves periodos de tiempo,
la cual ha pasado a través de los sentidos con anterioridad, con una ca-
pacidad de almacenar la información por un tiempo promedio de entre 15
y 30 segundos. Esta posee una duración mayor a la memoria sensorial y
funciona bajo la directriz del número mágico 7 más o menos 2 (Manzane-
ro, 2008). También, está regida bajo los efectos de la primicia y ultimidad,
donde, en una serie de estímulos presentados, es más fácil recordar el
primer y el último estímulo presentado; mientras que los que se encuen-
tran en el medio tienden a ser olvidados más fácilmente.
La MCP produce cambios en las estructuras neuronales implícitas,
estos cambios son fugaces y se basan en cambios químicos o eléctri-
cos de manera momentánea (Morgado, 2005), a diferencia de los cam-
bios en la MLP, en donde se puede hablar sobre cambios permanentes
en la estructura neuronal. “La corteza prefrontal dorsolateral juega un
papel crítico en los proceso realizado por la MCP, incluyendo procesos
de la memoria sensorial” (Alain, Woods & Knigth, 1998, N.A).
La importancia de la MCP radica en que por esta pasa la información
cuando es percibida y, luego, es codificada, siendo este uno de sus ro-
les más importantes ya que consolida la información (Manzanero, 2008);
posteriormente, la transmite a la memoria de largo plazo (MLP) para su
almacenamiento y posterior recuperación, debido a que la MCP es donde
se activa la información procedente de la MLP (Manzanero, 2008).
Fueron innumerables los trabajos con memoria de corto plazo;
durante los años 60 donde se vio un auge por la investigación sobre
este tema (Ballesteros, 1999), especialmente, con las investigaciones de
George A. Miller, pionero de la psicología cognitiva, quien tuvo un interés
particular sobre la memoria y cuya obra más célebre es “The magical
number seven, plus or minus two: some limits on our capacity for proces-
sing information”, donde habla sobre las limitaciones de la capacidad
de la memoria humana, llegando a la conclusión de que la capacidad
de almacenamiento de los seres humanos es de 7 más o menos 2 tro-
zos (chunk) de información, debido a la capacidades biológicas del ser
humano, pero, también, a la atención, importancia y compresión del
estímulo; con esto se comprende más acerca del procesamiento de la
memoria (Manzanero, 2008).

Me m o r i a a u d i t i va
La memoria auditiva se define como la capacidad de procesar, alma-
cenar y recordar la información auditiva que escuchamos. Su importancia 13
radica en el habla, puesto que gracias a esta aprendemos nuestra lengua
materna; en esta se almacenan sonidos y tonos, la información sensorial
auditiva es almacenada en la memoria ecoica. La información es registra-
da en la corteza auditiva primaria (Glass, Sachse y Suchodoletz, 2008). La
memoria auditiva de corto plazo es la capacidad de recordar información
auditiva por breves periodos de tiempo; posee un rango de duración de
aproximadamente 3 a 5 segundos.

Memoria ecoica
Es la encargada de conservar los registros y representaciones sen-
soriales de la memoria auditiva y tiene una duración aproximada de entre
30 y 100 milisegundos (Baddeley, 2002), por lo cual posee un almace-
namiento limitado, su decaimiento se puede deber a características del
estímulo, como tono, frecuencia e intensidad. Esta está dividida en dos
fases: la primera relacionada con la memoria de corto plazo, debido a
sus limitadas capacidades de retención, y la otra se relaciona más con
la MLP, ya que la información es integrada por medio de la comparación
con patrones existentes. Los errores que se presentan en esta se pueden
deber a fallos en el vocabulario, la pronunciación o dificultades en el pro-
cesamiento fonológico (Glass, Sachse & Suchodoletz, 2008).
Investigaciones recientes, como la de Ozubko, Hourihan y Macleod
(2012), donde realizaron 3 ensayos con diferentes intervalos de tiempo,
dieron como resultado una mayor memorización en la lectura en voz alta
que de manera silenciosa, los autores concluyen que leer en voz alta da
como resultado cambios permanentes en la retención de información
debido a la codificación adicional, lo cual fortalece la retención de infor-
mación (MacLeod, 2011) y por ello puede ser un buen método de estudio.
En un estudio anterior, MacLeod (2011) buscaba comprobar si las
producciones de otra persona son recordadas de la misma manera
que las producciones auto-realizadas. Como método, usó dos listas
de palabras para dos grupos, una lista era leída en voz alta por el
participante del experimento y la otra fue leída por otra persona en
voz alta para los dos grupos; concluyó que es más sencillo recordar la
auto-producción que la realizada por otra persona, revelando que hay
un “gradiente” provocado por el efecto de la auto-producción.
Otro estudio realizado por Robert G. Crowder en 1970, con el
cual buscaba saber el papel de la voz propia en la memoria inme-
diata, por medio de dos experimentos, con los cuales comparaba la
voz activa con la pasiva por medio de una serie de dígitos presen-
tados visualmente. Los resultados de este experimento fueron, que
la vocalización silenciosa permite la recuperación con mayor fa-
cilidad de los últimos dígitos de la serie, mientras que la vocaliza-
14 ción activa mejora el recuerdo de los primeros puestos de la serie.

M é to d o
MEDIR Y EVALUAR

diseño

Para cumplir con los objetivos del trabajo, se llevó a cabo un estu-
dio cuantitativo de tipo experimental, con un muestreo de tipo aleato-
rio simple en población específica.

pa r t i c i pa n t e s

El instrumento se aplicó a 30 personas de la Facultad de Ciencias


Humanas en la Universidad Nacional de Colombia, en su sede ubicada
en la ciudad de Bogotá-Colombia, a las cuales se les preguntó la edad,
la carrera y el semestre al que corresponden, con el fin de evidenciar
las características de la muestra empleada.
La edad promedio fue 20,90 con una desviación de 3,122; una edad
mínima de 17 y máxima de 33 años. La distribución por edad se puede
apreciar en la Tabla 1. En cuanto a la distribución por género fue del 60 %
masculino y 40 % femenino.

EDAD FRECUENCIA PORCENTAJE

17 1 3,3

18 2 6,7

19 9 30,0

20 6 20,0

21 4 13,3

22 1 3,3

23 3 10,0

24 1 3,3

25 1 3,3

26 1 3,3

33 1 3,3

Total 30 100

Tabla 1. Distribución de la muestra por edad.

La distribución por semestre fue del 6,7 % de las personas per-


tenecientes a primer semestre; 6,7 % a segundo semestre; 13,3 % a
tercer semestre; 26,7 % a cuarto semestre; 23,3 % a quinto semestre;
6,7 % a sexto semestre; 6,7 % a séptimo semestre; 3,3 % a octavo
semestre, y 6,7 % a decimo semestre. En relación con la carrera que 15
cursan los participantes, se encontró que el 6,7 % pertenecen a la ca-
rrera de Lingüística; 10 % a Trabajo Social; 3,3 % a Geografía; 46,7 % a
Psicología; 6,7 % a Filosofía; 16,7 % a Antropología, y 10 % a Sociología.

i n s t r u m e n to s

Para realizar este experimento, se definieron dos variables: el mé-


todo de lectura que le correspondió a cada participante representa la
variable independiente; mientras que la cantidad de respuestas co-
rrectas (entiéndase por respuestas correctas, el número de palabras
recordadas por el participante) es la variable dependiente.
Además, en este experimento se usó una lista de quince palabras
de tres sílabas cada una, todas pertenecientes a la categoría de sus-
tantivos, extraída del Corpus de Referencia del Español Actual (CREA),
realizado por la Real Academia Española1, junto con un cronómetro
para medir el tiempo entre la presentación de la palabras y el cuestio-
namiento de cuántas recordaba.

1 Una muestra de la lista usada se encuentra en la sección de anexos (Anexo 1)


P ro c e d i m i e n to
Se condujo a los participantes, junto con un investigador, de forma
individual a un ambiente controlado, donde no se presentaron sonidos o
acciones de un tercero que pudieran distraer al sujeto.
De forma aleatoria, se repartió a los participantes en dos grupos
de igual tamaño donde, dependiendo del grupo, se les pidió que reali-
zaran una de las siguientes acciones:
1. Al primer grupo se le pidió que leyera la lista de palabras en voz alta
una sola vez, intentando memorizarla.
2. Al segundo grupo se le pidió que leyera mentalmente una sola vez la
misma lista de palabras, intentando, a su vez, memorizarlas.
Tras la lectura de la última palabra por parte de los participantes,
se esperó un tiempo de 30 segundos, tras los cuales se les solicitó que
dijeran, en voz alta, la mayor cantidad de palabras que podían recor-
dar, contabilizando el número de palabras recordadas, independiente-
mente del orden en que las dijeran.
Después de ordenar los datos, se observó el comportamiento de
los mismos por medio de una prueba Shapiro-Wilk y una comparación
de medias por medio de la prueba no paramétrica, U de Mann-Whitney,
además de descriptivos en aquellos casos que era factible realizarlo.
Esto se realizó por medio del programa IBM SPSS Stastistics V. 20.

Consideraciones éticas
Para realizar esta investigación, se solicitó el consentimiento infor-
mado1 de la totalidad de los participantes, luego de informarles el proce-
16 dimiento a realizar y el objetivo del mismo, además de darles la oportu-
nidad de abandonar el experimento en el momento que así lo desearan.
MEDIR Y EVALUAR

R e s u lta d o s
En la tabla número 2 se presentan los descriptivos correspon-
dientes a los números de aciertos que presentaron la totalidad de par-
ticipantes independiente del grupo al que pertenecieran.

Descriptivos Valor

Media 5,93

Desviación estándar 2,638


Número de aciertos
Mínimo 2

Máximo 15

Tabla 2. Descriptivos del número de aciertos.

1 Una muestra del formato del consentimiento informado utilizado se encuentra


en el Anexo 2.
Pruebas de normalidad
Se realizó una prueba de normalidad de los resultados de la prue-
ba, por medio del estadístico Shapiro-Wilk, donde se plantea como hi-
pótesis nula que los datos tienen un comportamiento de una curva
normal. Los resultados se presentan en la tabla 3.

Shapiro-Wilk

Estadístico gl. Sig.

n.º aciertos 0,894 30 0,006

Tabla 3. Prueba de normalidad Shapiro-Wilk.

Prueba U de M a n n -W h i t n e y
Debido a que los datos no presentan un comportamiento de
una curva normal y ya que la cantidad de datos es menor a cincuenta,
se procede a realizar una prueba U de Mann-Whitney planteando la
hipótesis alternativa de que hay una diferencia estadísticamente signi-
ficativa entre los grupos. Los resultados se presentan en la tabla 4.

Estadísticos de Contraste

U de Mann-Whitney 96,500

Sig. asintót. (bilateral) 0,503 17

Sig. exacta [2*(Sig. unilateral)] 0,512

Tabla 4. Prueba de Mann-Whitney Número de Aciertos - Grupo.

Debido a que se aceptó la hipótesis nula con una significancia de


0,05, se procedió a hallar los descriptivos de los números de aciertos
en relación con los grupos para evidenciar más fácilmente los resul-
tados obtenidos con la prueba U de Mann-Whitney. Los resultados se
presentan en la Tabla 5.
Descriptivos Valor

Número Lectura en
Media 5,93
de aciertos voz alta

Desviación estándar 1,792

Mínimo 3

Máximo 9

Lectura mental Media 5,93

Desviación estándar 3,348

Mínimo 2

Máximo 15

Tabla 5. Descriptivos Número de Aciertos - Grupo.

Los resultados de la prueba denotan que no hay una diferencia


significativa entre los grupos; por ello, se procedió a comprobar si
existe alguna diferencia estadísticamente significativa en los resulta-
dos según el género. Los Resultados se presentan en la tabla 6 y, en la
tabla 7, se presentan los descriptivos para evidenciar más claramente
los resultados.

Estadísticos de Contraste

U de Mann-Whitney 79,000

18 Sig. asintót. (bilateral) 0,215

Sig. exacta [2*(Sig. unilateral)] 0,232


MEDIR Y EVALUAR

Tabla 6. Prueba de Mann-Whitney Número de Aciertos – Género.

Descriptivos Valor
Número de
Hombre Media 6,44
Aciertos
Desviación estándar 2,77
Mínimo 3
Máximo 15
Mujer Media 5,17
Desviación estándar 2,329
Mínimo 2
Máximo 9

Tabla 7. Descriptivos Número de Aciertos – Género.


En relación con estos resultados, se encuentra que no hay una
diferencia estadísticamente significativa de 0,05, entre los hombres y
las mujeres en los números de resultados presentados en la prueba.

Discusión
Los resultados de la investigación realizada han mostrado que no
existe una diferencia significativa, con respecto a la influencia de la
lectura en voz alta o mentalmente, en la memoria a corto plazo, a la
hora de recordar una serie de palabras, lo cual replantearía la idea de
que se da una mejor memorización de la información cuando se lee
en voz alta.
De acuerdo con los resultados, se presenta una leve referencia a
lo estudiado por George A. Miller, puesto que la media de la población
fue de 5.93, con una desviación estándar de 2,638, lo que permitiría
indicar que su teoría del número mágico 7 más o menos 2, estaría en
lo correcto; pero, debido a las limitaciones que presenta este experi-
mento, no se puede afirmar totalmente esto, aunque se podría revisar
con estudios posteriores.
A pesar de que la muestra utilizada en el experimento es dema-
siado pequeña para hacer generalizaciones sobre el general de los
universitarios, los resultados obtenidos en este proyecto sí presen-
tan contradicciones bastante notorias con investigaciones como la de
Ozubko, Hourihan y Macleod (2012), donde se plantea que hay una me-
jor memorización de información cuando se lee en voz alta que cuando
se lee mentalmente, ya que en el estudio presentado no se encontró
que estas diferencias fueran significativas. 19
En conclusión, debido a que no se usó una gran tamaño de pobla-
ción, el resultado de este experimento no podría ser generalizado pues
las diferencias entre estos resultados y los obtenidos anteriormente
por otros investigadores podrían deberse a características específicas
de la población utilizada o las diferencias intersubjetivas en la capaci-
dad de memorización de cada sujeto; sin embargo, esta prueba podría
servir de piloto para una con mayor muestra y que, a su vez, busque
investigar la memoria a corto plazo.
Referencias

Alain, C., Woods, D. & Knigth R. (1998). A distributed cortical network for auditory
sensory memory in humans. Brain Research, 812(1998), 27-37. Recuperado
de: http://www.ebire.org/hcnlab/papers/1999aAlain.pdf
Baddeley, A. (2002). Human memory: theory and practice. Reino Unido: Taylor
and Francis Group.
Ballesteros, S. (1999). Memoria humana: investigación y teoría. Psicothema,
11(4),705-723.
Crowder, R. (1970). The role of one's own voice in immediate memory. Cogni-
tive Psychology, 1(2), 157-178. Recuperado de: http://www.sciencedirect.
com/science/article/pii/0010028570900113
Etchepareborda, L. & Abad-Mas, L. (2005). Memoria de trabajo en los proce-
sos básicos del aprendizaje. Revista de Neurología, 40(Supl. 1), S79-S83.
Recuperado de: http://www.lafun.com.ar/PDF/21-MT_en_los_proce-
sos_de_48C50.pdf
20 Glass, E., Sachse, S. & Suchodoletz, W. (2008). Development of auditory sensory
memory from 2 to 6 years: an MMN study. Journal of Neural Transmission,
115(8), 1221-1229. DOI: 10.1007/s00702-008-0088-6.
MEDIR Y EVALUAR

MacLeod, C. M. (2011). I said, you said: The production effect gets personal.
Psychonomic Bulletin & Review – Springer, (18), 1197-1202. Recuperado
de: http://link.springer.com/article/10.3758%2Fs13423-011-0168-8/
fulltext.html
Manzanero, A. L. (2008). Aspectos básicos de la memoria. En: A. L. Manzanero,
Psicología del Testimonio (pp. 27-45). Madrid: Ed. Pirámide.
Morgado, I. (2005). Psicobiología del aprendizaje y la memoria: fundamentos y
avances recientes. Revisión en Neurociencia, 40(5), 289-297. Recuperado
de: http://blocs.xtec.cat/escolamargalloedu/files/2013/06/Apr-y-Mem-
RN-20053.pdf
Ozubko, J., Hourihan, K., & MacLeod, C. (2012). Production benefits learning: the
production effect endures and improves memory for text. Memory, 20(7),
717-727. Recuperado de: http://www.tandfonline.com/doi/abs/10.1080/096
58211.2012.699070?url_ver=Z39.88-2003&rfr_id=ori:rid:crossref.org&rfr_
dat=cr_pub%3dpubmed#preview.
ANEXO 1
M o d e lo d e l a l i s ta d e pa l a b r a s u s a d a s
e n e l e x p e r i m e n to

Cultura
Cabeza
Gobierno
General
Partidos
Trabajo
Nacional
Personas
Sistema
Relación
Problema
Proyecto
Militar
Paciente
Humano

ANEXO 2
M o d e lo d e l c o n s e n t i m i e n to informado 21

Yo ______________________________________________
_________identificado(a) con ____ numero_______________ de
_________________________ confirmo que fui informado (a) de
los propósitos y la metodología del presente estudio sobre Lectura
y Memoria, en el cual decido participar voluntariamente, teniendo
en conocimiento que me puedo retirar del mismo en cualquier mo-
mento.

Firma _____________________________
P R O C E S O D E E VA L U A C I Ó N
PSICOLÓGICA A UN NIÑO
DE QUIÉN SE SOSPECHA
H A B I L I DA D E S C O G N I T I VA S
SUPERIORES

P s yc h o l o g i c a l a s s e s s m e n t p r o c e s s
with a child who suspected higher
c o g n i t i ve a b i l i t i e s

R esu m en
22
El presente trabajo tiene como objetivo descri- se determinó evaluar inteligen-
bir y sustentar el proceso de evaluación psicológi- cia, atención, memoria, depre-
MEDIR Y EVALUAR

ca realizado en el Servicio de Atención Psicológica sión y funcionamiento afectivo. A


(SAP) a un niño de 10 años. La hipótesis inicial, con partir del contraste entre los re-
la cual lo remite su institución educativa es super- sultados obtenidos con las prue-
dotación intelectual; esto debido a que sus maes- bas aplicadas y la información
tros afirman observar, en él, algunas de las conduc- aportada por la entrevista inicial
tas típicas de esta población. Al presentar este caso se pudo hacer un análisis multi-
como modelo de evaluación psicológica se preten- dimensional que permitió falsear
de llamar la atención sobre la importancia de hacer la hipótesis inicial.
una evaluación multidimensional cuando se busca
evaluar la existencia de superdotación intelectual,
de tal forma que el proceso logre responder al con- Palabras clave:
texto particular del consultante. Dentro del proceso Evaluación psicológica,
habilidades cognitivas superiores,
superdotación intelectual,
inteligencia, depresión.
Diana Marcela Botina Villarreal / [email protected]
María Fernanda Ferrucho Segura / [email protected]
Laura Alejandra Mora Gutiérrez / [email protected]
Psicólogas
Universidad Nacional de Colombia, sede Bogotá

A b stract
23
The following paper aims to describe and tablished to assess intelligence,
support the process of psychological assessment attention, memory, depression
conducted by the Servicio de Atención Psicológica and emotional functioning. From
(SAP) to a 10-year-old child. Initial hypothesis, pro- the contrast between the results
vided by the educational institution, states intellec- achieved by the conducted tests
tual giftedness; this is based on the child’s teachers and the information provided by
that claim to notice some common behaviours of the initial interview, it was possi-
this population in him. By presenting this case as ble to make a multidimensional
a psychological assessment model, it is intended analysis that contradicted the
to draw attention to the importance of conducting initial hypothesis.
a multidimensional assessment when assessing
the existence of intellectual giftedness so that the
process is capable of responding to the patient Keywords:
particular context. Within the process, it was es- Psychological assessment,
higher cognitive abilities,
intellectual giftedness,
intelligence, depression.
Introducción
Evaluar es un proceso que nace de la necesidad de aplicar los
principios del método científico para medir las diferencias individua-
les existentes entre personas (Nunes, García & Scortegagna, 2006). La
inteligencia es una de las diferencias que interesa medir y, desde hace
ya más de un siglo, se han desarrollado diferentes pruebas o test que
parten de alguna determinada concepción acerca de lo que esta es. La
primera Escala de Inteligencia fue la desarrollada por Binet y Simon
(1905), y su objetivo era distinguir entre niños con retraso mental y
niños con inteligencia normal. Cabe señalar que la postura de Binet,
se centraba en los productos de la inteligencia y no en los parámetros
psicofísicos de la misma, marcando una ruptura con la corriente que
había iniciado Sir Francis Galton, quien consideraba que, a través de
la medición de parámetros de orden fisiológico tales como: umbrales
de percepción, tiempo de reacción, agudeza visual, capacidad respi-
ratoria, entre otros, sería posible hacer una medición objetiva de la
inteligencia (Mora & Martín, 2007). El objetivo que se propusieron Binet
y Simon (1905) era completamente diferente: “Explorar procesos men-
tales de orden superior, tales como la memoria, las imágenes menta-
les, la comprensión o el juicio” (Mora & Martín, 2007, p. 308).
Hoy en día existen procesos de evaluación, diseñados muy cuida-
dosamente, que permiten no sólo medir la inteligencia, sino también
la personalidad, la salud emocional y muchos otros constructos que
son de interés tanto para la psicología como para otras disciplinas.
Para el caso de la psicología clínica, contar con instrumentos válidos
24 y confiables es uno de los requerimientos previos principales para
identificar el tratamiento apropiado a aplicar en cada caso específico
(Caballo, 2005). Sin embargo, cabe aclarar que el proceso de evalua-
MEDIR Y EVALUAR

ción psicológica puede incluir la aplicación de pruebas estándar y/o no


estándar. Adicionalmente se requiere de una primera información que
es recogida en una entrevista inicial de la cual se identifican caracte-
rísticas específicas del sujeto, del ambiente y la relación entre ellos
(Nunes, García y Scortegagna, 2006), con esta información se obtiene
una visión más amplia a partir de la cual se formula una hipótesis y
de la misma manera se identifica qué instrumentos se van a utilizar
(Fernández-Ballesteros, 1997).
Otro aspecto importante de la evaluación psicológica, es el com-
promiso ético que asume el profesional, el cual consiste principalmen-
te en evitar vulnerar los derechos y deberes del consultante. Además
de la obligatoriedad de presentar el consentimiento informado al
consultante, ó a su acudiente según corresponda, dicho compromi-
so se relaciona directamente con el buen uso de los instrumentos de
medición disponibles de acuerdo con el fin, de tal forma que es un
requerimiento fundamental la adecuada comprensión de las técnicas
a aplicar; sólo así es posible ofrecer y garantizar el mayor beneficio
al consultante, respetando sus características particulares y evitando
efectos nocivos o situaciones de riesgo. (Tribunal Nacional Deontoló-
gico y Bioético, 2012).
A partir de lo anterior, y atendiendo al interés del psicólogo por
obtener resultados válidos y confiables, los procedimientos e instru-
mentos a aplicar en un determinado caso deben responder a la par-
ticularidad del sujeto, teniendo en cuenta la edad, género, país de ori-
gen, entre otras variables que pueden limitar el rango de aplicabilidad
de una prueba. Así mismo el manual debe aportar el suficiente sus-
tento acerca de los criterios de validez y confiabilidad requeridos. En
el apartado denominado “Método”, se describen los instrumentos ele-
gidos para aplicar en el presente proceso de evaluación psicológica.
Respecto al tema de la identificación de niños con habilidades cogni-
tivas superiores, hay que decir que, aunque existe una vasta teoría, son
pocos los acuerdos entre los postulados de distintos autores (Paba, Cer-
chiaro y Sánchez, 2008). Tal como lo afirma Sastre-Riba (2008), el cono-
cimiento acerca de la naturaleza y el funcionamiento de la alta capacidad
intelectual es borroso, por tal motivo todavía no hay unidad en los pará-
metros de identificación y tampoco en las pautas de intervención.
La falta de claridad en la definición de lo que es poseer “superdo-
tación a nivel cognitivo” ha dado origen a varias de las creencias equi-
vocadas. Según lo reporta Castro (2012), algunos de los mitos princi-
pales sobre un posible “niño superdotado” son: Poseen características
muy homogéneas entre sí; se definen exclusivamente por tener un alto 25
cociente intelectual (CI) con puntuación superior a 130; gracias a su
rendimiento académico superior no necesitan atención educativa es-
pecífica; tienen necesariamente problemas de desadaptación social y
una alta motivación por las actividades escolares; etc. Sin embargo,
estas ideas no tienen sustento empírico suficiente, por lo tanto, no de-
ben considerarse una base para definir un proceso de evaluación.
Pese a las dificultades señaladas anteriormente, hoy en día se re-
conoce que ni la inteligencia, ni la superdotación intelectual son de
carácter unifactorial, por el contrario, están conformadas por diversos
factores, de forma similar a lo propuesto por Thurstone (1938), quien
sostuvo que algunas de las aptitudes mentales primarias eran fluidez
verbal, habilidad numérica, comprensión visual, percepción, memoria,
razonamiento inductivo/deductivo, entre otras (Castello y de Batlle,
1998). Entonces, para identificar la existencia de superdotación inte-
lectual es necesario no sólo basarse en la información aportada por
un test de CI, sino también debe realizarse un proceso que permita
hacer mediciones cognitivas multidimensionales (Sastre-Riba, 2008).
Para lograr una medición integral de las diferentes habilidades
cognitivas que determinarían la existencia de superdotación intelectual,
el primer paso es la aplicación de una prueba de inteligencia recono-
cida por su confiabilidad y validez. Para el presente caso, una prueba
adecuada es la Escala de inteligencia de Wechsler para Niños, cuarta
versión (WISC – IV). Sin embargo, en este punto vale mencionar que de-
bemos atender a la alerta acerca de la medición de la inteligencia hecha
por la American Psychological Association (2014), organización autora
de la última versión del WISC, la cual afirma que los test de inteligencia
no miden todos los tipos de inteligencia, como por ejemplo la inteligen-
cia social; sino que únicamente evalúan el funcionamiento intelectual
de una persona en comparación con una población de su misma edad y
originaria de un contexto cultural cercano al del evaluado (en los casos
en que existe una versión adaptada para el lugar de donde el sujeto es
originario). Por lo anterior, es importante tener en cuenta que los re-
sultados de este tipo de pruebas no pueden aportar un juicio conclu-
yente con respecto a si una persona tiene o no habilidades cognitivas
superiores; entonces, además del WISC-IV se requieren otras pruebas
adicionales para dar un resultado al consultante. Para el presente caso
resulta necesario evaluar adicionalmente la atención, la memoria y el
nivel de depresión del consultante. A continuación, se realiza una breve
explicación de cada uno de los constructos mencionados, y que se han
tomado como referencia para efectos de la presente investigación.
La atención es uno de los procesos psicológicos básicos, indis-
pensable para el procesamiento de la información de cualquier tipo.
26 La atención es un proceso que ayuda, facilita y participa en todos los
procesos cognitivos superiores. Dado que los seres humanos están
expuestos a una sobreestimulación ambiental, es indispensable el
MEDIR Y EVALUAR

aprendizaje y desarrollo de mecanismos cognitivos capaces de selec-


cionar lo necesario, y así mismo, no saturar el cerebro de informa-
ción inútil. La información obtenida a través de estímulos auditivos,
visuales, olfativos, etc., debe ser filtrada y seleccionada por el suje-
to, pues es imposible estar atento a todo lo que los rodea; y aunque
existen órganos especializados en la recepción e interpretación de la
información, el proceso cognitivo básico, el de mayor participación y
más implicado en la selección de los estímulos necesarios para dar
respuestas oportunas a las demandas del medio, es la atención. Sin
embargo, ésta no siempre opera de manera óptima, puede alterarse y
traer consigo dificultades laborales, familiares, escolares, entre otras,
por lo que se hace necesario un proceso de evaluación e intervención.
Entonces, la importancia de la atención no solo radica en el proce-
samiento de la información, sino también en que tiene implicaciones
conductuales y emocionales (Londoño, 2009).
En cuanto a la memoria, es un proceso psicológico que sirve para
almacenar experiencias e información, que más adelante se podrán recu-
perar en beneficio del individuo; este proceso se puede generar de mane-
ra voluntaria o involuntaria (Ballesteros, 1999). Hay ocasiones en que esta
recuperación se hace de manera inmediata, por asociaciones con lugares
o sonidos; sin embargo, también se da cuando se necesita traer de ma-
nera consciente alguna información importante en un momento indicado,
permitiendo gestionar o administrar el pasado (Sola, 2013). En personas
sanas el funcionamiento de la memoria es normal, contribuyendo así
con una buena adaptación a la vida cotidiana y a las labores a las que
se tenga que enfrentar; en efecto, la memoria está relacionada también
con la supervivencia y la selección natural, ya que con la recuperación de
información antes codificada se pueden prevenir episodios en los que la
persona deba enfrentarse a un determinado peligro o simplemente re-
cordar lugares en donde se encuentran los alimentos o notas importantes
(Ballesteros, 1999). En personas cuyo funcionamiento o recuperación no
es eficaz, se presentan problemas tales como olvidar cosas importantes,
lugares y personas, puesto que la retención de información no es la me-
jor; esto hace que el desarrollo normal se vea afectado y la calidad de vida
de la persona disminuya.
Por otra parte, la depresión clínica es un trastorno del estado de
ánimo caracterizado por una sensación de tristeza intensa, superior a
dos meses (Piqueras y cols., 2008) que define un “estado personal de
distinta experiencia subjetiva”, (Abello y cols., 2008, p. 5) y comúnmente
se define por cuatro tipos de síntomas: afectivos (ej. tristeza), cognitivos
(ej. pensamientos), conductuales (ej. actitud desganada) y físicos (ej. falta 27
de energía) (Abello y cols., 2008). El modelo de depresión de Beck (1974)
considera que esta patología es reflejo de los problemas cognitivos de la
persona, que se evidencia cuando esta lleva a cabo la evaluación acerca
de sí mismo, de su entorno y su futuro (triada cognitiva), y a su vez, en los
esquemas y errores cognitivos; así, para Beck la depresión no es un tras-
torno afectivo sino cognitivo (Rodríguez de Alba y Suárez, 2012).
En el caso de los niños, la depresión prevalece significativamente
en las alteraciones del comportamiento, las cuales se manifiestan por
ejemplo en alteraciones del humor. Este tema ha demandado impor-
tancia ya que su aparición en la infancia sigue un curso crónico y pue-
de desarrollar consecuencias secundarias como alcoholismo, déficits
psicosociales, personalidad antisocial, bajo rendimiento académico,
etc. (Solloa, 2001; en Herrera, Núñez, Tobón y Arias, 2009).
El caso objeto de estudio se describe en el apartado participante,
y cabe mencionar que el interés por documentar dicho caso surgió a
partir de la información obtenida durante la entrevista inicial de la que
participaron el niño y su madre.
La madre del menor acude al SAP por solicitud de la institución
educativa, ya que, según ella, los maestros reportaron que en el pre-
sente año lo han percibido muy aburrido en las actividades académi-
cas, además, distraído, desobediente, desinteresado e incluso somno-
liento. Lo anterior ha llevado a un brusco descenso en el rendimiento
académico de A, sin embargo, la hipótesis formulada por los maestros
es “habilidades cognitivas superiores”, basados en el hecho de que
A siempre ha tenido un rendimiento académico destacado, y que, a
pesar de los inconvenientes señalados, él contesta acertadamente la
mayoría de preguntas que se le plantean en clase.
Considerando el requerimiento con el que el participante es lle-
vado a consulta, la primera hipótesis a falsear cuando se sospecha
que un niño tiene altas capacidades intelectuales sería: el niño da
muestra de que posee habilidades cognitivas y de procesamiento de
información superiores a la media de acuerdo a su edad. Sin embargo
es importante hacer énfasis en que, para falsear o confirmar dicha
hipótesis, no es suficiente con aplicar un instrumento psicológico dise-
ñado para la evaluación de la inteligencia del sujeto, pues como ya se
mencionó estos instrumentos no permiten evaluar todas las dimensio-
nes de la inteligencia, entonces deben evaluarse otras herramientas
cognitivas asociadas al adecuado funcionamiento de la inteligencia so-
cial del consultante; más aun teniendo en cuenta que en la entrevista
inicial el niño mostró actitudes de desinterés por las actividades aca-
démicas, tristeza, y también falta de atención y concentración, por lo
que es posible inferir la existencia de problemáticas asociadas de un
28 déficit atencional, un déficit de memoria y de desórdenes emocionales.

M é to d o
MEDIR Y EVALUAR

P a r t i c i pa n t e
Un niño de 10 años y 9 meses, de sexo masculino. El participan-
te, quien en adelante será denominado A, cursa cuarto grado en un
colegio bilingüe de la ciudad de Bogotá, Colombia, no posee alguna
patología psicológica diagnosticada. Adicionalmente, ni A ni su familia
pertenecen a alguna comunidad étnica o religiosa determinada.
Con respecto a la vida académica del menor hay que resaltar
que se trata de un colegio bilingüe de alta exigencia académica, y don-
de la jornada va desde las 7 am a las 2 pm, extendiéndose algunos días
hasta las 4 pm por tutorías académicas. Adicionalmente A está inscri-
to en una fundación bilingüe a la que debe asistir todos los sábados de
8 am a 12 m. Los padres del niño determinaron matricular al niño en
tales instituciones debido a que anhelan que A obtenga una beca de
intercambio para estudios en el exterior y para ello requieren darle al
niño la mejor formación posible.
El núcleo familiar de A está compuesto por sus padres biológicos
y una hermana menor. La madre tiene 45 años y el padre 44, el nivel
de escolaridad de los dos es profesional; la hermana menor tiene 4
años y cursa actualmente jardín. Con respecto a la situación socioe-
conómica, la madre comenta que la familia atravesaba por una crisis
económica que los llevó a vender la casa donde el niño había pasado
toda su infancia y a trasladarse a una vivienda mucho más pequeña,
donde él debe compartir habitación con su hermana.
Otro factor importante tiene que ver con la relación de A con su
hermana menor, pues para él ha sido difícil aceptarla como un miembro
de la familia, tanto así que él no muestra afecto hacia ella, y a su vez
se muestra celoso de la madre, de quien actualmente demanda mucha
mayor atención que antes de que la niña naciera, aunque en ocasiones
su actitud es ambivalente y tiende a irrespetar el rol de autoridad que
ella tiene. Los problemas familiares mencionados han llevado a la fami-
lia a acudir a terapia familiar en dos oportunidades anteriores.
Cabe resaltar que, a partir de la entrevista inicial, realizada con A
y su madre, fue posible obtener la información necesaria para esta-
blecer los instrumentos y procedimientos a aplicar en el proceso de
evaluación psicológica.

I n s t ru m e n to s
Escala Wechsler d e i n t e l i g e n c i a pa r a N i ñ o s (WISC- IV).
La inteligencia se midió a través del WISC-IV, adaptación española.
Esta prueba explora y evalúa las capacidades cognoscitivas, consta
de 15 subpruebas agrupadas en cuatro índices que representan habi- 29
lidades intelectuales generales (comprensión verbal y razonamiento
perceptivo) y habilidades de procesamiento cognoscitivo (memoria de
trabajo y velocidad del procesamiento). Adicionalmente el test es apli-
cable preferentemente a sujetos que necesiten determinar su nivel de
habilidades cognoscitivas o su funcionamiento neuropsicológico, en-
tre ellas diagnóstico de altas capacidades. La existencia de criterios
de confiabilidad y validez se encuentra ampliamente documentada en
Wechsler (2005); allí se observa evidencia del análisis de confiabilidad
de ítems pares e impares, excepto para el apartado denominado Re-
tención de Dígitos, que requiere del uso de formas paralelas o equiva-
lentes; y también existe información de datos de validez de contenido,
de constructo y de criterio.
El WISC-IV es aplicable a niños y adolescentes de edades com-
prendidas entre 6 años 0 meses y 16 años 11 meses (Consejo General
de Colegios Oficiales de Psicólogos, s.f.).
Figura compleja de Rey
La figura compleja de Rey evalúa capacidades perceptivas y motrices,
la habilidad de construcción en el plano gráfico y la organización visual
(Lara, Galindo, Romero, Salvador y Domínguez (2003); se utiliza principal-
mente con personas que tienen problemas en fijar y retener información.
Esta prueba consiste en copiar y luego reproducir de memoria un di-
bujo geométrico complejo que reúne propiedades como ausencia de sig-
nificado y facilidad en la realización gráfica, pero con una estructura que
en conjunto es lo suficientemente complicada para exigir actividad ana-
lítica organizadora. El tiempo estimado de aplicación es de 10 minutos,
dando una pausa no mayor a 3 minutos entre la copia y la reproducción de
memoria. Con la observación de la forma en que la persona copia la figu-
ra se puede conocer su actividad perceptiva hasta cierto punto, mientras
que la realización de la figura sin la presencia de la figura original informa
sobre el grado de memoria visual. Al sujeto se le muestra la figura, se le
entrega una hoja en blanco y un color, se debe disponer de cinco o seis
lápices de colores diferentes, y se le dan las indicaciones según indique el
manual. Periódicamente se le pide al niño que cambie de color con el fin
de poder analizar posteriormente el transcurso de copia que el sujeto lle-
vó a cabo, por ejemplo, en el caso de niños se espera que empiecen de pe-
queños detalles a estructuras más grandes (Rey, 2009). Para calificar la
prueba se toma como base una clasificación de tipo de dibujo que consta
de siete categorías ordenadas de forma ascendente de acuerdo al grado
de racionalidad que muestra el dibujo, racionalidad que está determinada
por factores como la rapidez de la copia, la precisión del resultado y los
30 hábitos intelectuales (Rey, 2009).
Las propiedades psicométricas de esta prueba, como son la con-
fiabilidad y la validez, han sido revisadas en varios países de habla
MEDIR Y EVALUAR

hispana, ejemplo de esto es el estudio realizado por Cortes, Galindo y


Salvador (1996), donde la confiabilidad hallada para el ejercicio de copia
fue de 0,828, y para el ejercicio de memoria de 0,783. Adicionalmente,
“el análisis factorial mostró que las dieciocho unidades perceptuales se
agrupan en forma congruente en cuatro factores que explican 43.6 % de
la varianza total de la copia y 38.6 % de la memoria” (Cortes, Galindo y
Salvador, 1996, p. 42).

Test de colores y palabras Stroop


Para evaluar el desempeño en atención selectiva, se decidió aplicar
el test de colores y palabras Stroop, ya que es una herramienta utilizada
ampliamente en la detección de disfunciones cerebrales que relaciona-
das con la atención, más específicamente la atención selectiva, la aten-
ción dividida y a la distractibilidad en general; también ha sido aplicada
para medir procesos cognitivos muy diversos relacionados con la flexibi-
lidad, la capacidad de inhibición de respuestas automáticas y la velocidad
de procesamiento de la información (Herreras y Santos, 2006).
La prueba es apta para las edades entre 7 y 80 años, la duración
es de 5 minutos y consta de tres láminas cada una con 100 elementos
divididos en 5 columnas; en la primera se realiza la lectura de palabras;
la segunda lámina es de denominación de colores; y la tercera lámina es
la condición de interferencia palabras-colores. La fiabilidad del STROOP
se ha mostrado muy consistente en las versiones existentes; los investi-
gadores usaron el método test-retest comprendidos entre 1 minuto y 10
días entre aplicaciones (Golden, 1999).

Children's Depression Inventory (CDI)


Se aplicó el CDI con el fin de determinar la existencia de sintoma-
tología depresiva. El CDI es un cuestionario basado en un marco teórico
cognitivo estrictamente psicológico. Se considera que este instrumento
es bastante idóneo para medir el nivel de disforia y de autoestima ne-
gativa en niños de 7 a 15 años, pues posee la solidez psicométrica que
demanda la comunidad científica (Kovacs, 2004). Consta de 27 ítems, cada
uno con 3 enunciados ordenados de forma gradual en función del nivel
de depresión, entendida esta como la sumatoria de los factores disforia
y autoestima negativa (16 ítems evalúan la presencia de disforia y los 11
restantes evalúan autoestima negativa). La validez y confiabilidad de este
instrumento está ampliamente documentada por numerosas investiga-
ciones (Kovacs, 2004), incluyendo estudios realizados en Colombia (Se-
gura y cols., 2010).
Para la aplicación de la prueba se utiliza un ejemplar autocorre- 31
gible (de dos páginas), un lápiz y un borrador. La portada del ejemplar
trae las instrucciones de diligenciamiento de la prueba, sin embargo,
el psicólogo debe también darlas de forma verbal, teniendo cuidado
de no usar la palabra “depresión”. También es importante que el psi-
cólogo se asegure de que el niño atendió a la explicación verificando
con un ejemplo. De los tres enunciados de cada ítem, el niño deberá
seleccionar aquel que mejor describa los sentimientos e ideas que lo
han acompañado las últimas 2 semanas. Si el niño no responde una
pregunta, el psicólogo debe animarlo a que lo haga. Cada enunciado
tiene una puntuación que va de 0 (cero) a 2 (dos) de acuerdo con el
nivel de depresión que expresa; para calificar el test simplemente se
debe sumar la puntuación obtenida en cada ítem, luego se transforma
esa puntuación en una puntuación escalar cuyos baremos van de 0 a
100; estas tablas están diferenciadas por edad y sexo. Para el caso de
A, a partir de una puntuación de 90 se considera la existencia de sinto-
matología depresiva leve, y a partir de 96 se considera la presencia de
depresión severa (Kovacs, 2004).
Test d e lo s C u e n to s de H a d a s (FTT)
El FTT es una prueba proyectiva utilizada para evaluar rasgos
de personalidad, aptitudes y habilidades, este test está destinado a
obtener información de las características psicológicas que son re-
levantes para el funcionamiento afectivo y/o cognitivo en niños de 6 a
12 años (Guevara, Da Silva Nunes y Borges, 2014). Consta de 21 lámi-
nas que se presentan al niño en grupos de tres, cada grupo presenta
imágenes de cuentos de hadas muy populares, el tiempo en el que se
administra es 50 a 60 min; para aplicar este test el niño debe conocer
los cuentos, saber de qué tratan e identificar cada personaje, no es un
test de memoria, es un test donde se proyectan experiencias, miedos
y emociones. Se hacen algunas preguntas con respecto a cada imagen
que se presenta y se pide al niño dar a conocer su opinión; las lámi-
nas deben presentarse en el orden que se indica en el lado posterior,
adicionalmente se debe dejar claro que no hay respuestas correctas o
incorrectas (Cougacoglou, 2002).
La puntuación del FTT cuenta con 29 variables de personalidad que
pueden ser clasificados bajo 5 componentes principales que son: 1. De-
seos y necesidades, 2. Impulsos, 3. Relaciones objétales, 4. Estados emo-
cionales, y 5. Funciones del Super Yo. Las variables pueden puntuarse en
una escala de 1 a 3 de intensidad siendo: 1 Baja, 2 media y 3 alta.
En cuanto al estudio de confiabilidad se realizó test-retest y cali-
ficación interjueces; y el estudio de validez fue realizado por medio de
análisis factorial. En la prueba se utilizaron baremos españoles (Cou-
gacoglou, 2002).
32
P ro c e d i m i e n to
En la primera sesión, se dieron a conocer al consultante y a su
MEDIR Y EVALUAR

madre, sus derechos y deberes, se les hizo entrega del Consentimiento


Informado y se les explicó su contenido. Adicionalmente se les informó
que durante el proceso se garantizaría el buen uso de los instrumen-
tos a aplicar y el adecuado manejo que se le daría a toda la informa-
ción a obtener.
Ellos estuvieron de acuerdo y la firma del consentimiento quedó
como soporte de su aceptación. En la primera y segunda sesión se
realizó una entrevista con A y su madre, con el fin de obtener la mayor
información posible del contexto; ya que un adecuado acercamiento al
paciente permite obtener información valiosa, tanto de fuente verbal
como no verbal, que facilita la compresión del problema (Navarro, s.f.).
Por tal razón este espacio se debe usar un lenguaje común y mediando
la percepción global mutua, pues el buen manejo de la primera entre-
vista constituye uno de los factores fundamentales para la evolución y
desarrollo de la terapia (Davanzo, 2000). En dicha entrevista se logró
obtener información sobre el contexto de vida del niño, la conforma-
ción del núcleo familiar, y otros antecedentes.
En la tercera y cuarta sesión, cada una con una duración de 45 mi-
nutos aproximadamente, se aplicó el WISC-IV, ya que el tiempo estima-
do de aplicación del test es de 60 a 75 minutos como lo indica su ficha
técnica. En la quinta sesión, para evaluar la capacidad de memoria se
aplicó la Figura de Rey y el Test de Colores y Palabras (STROOP). En la
sesión número seis se llevó a cabo la aplicación del cuestionario CDI
para descartar que A no presentara algún tipo de depresión debido a
las observaciones de su estado de ánimo en las sesiones anteriores;
adicionalmente se aplicó el Test de los cuentos de Hadas, con el fin de
identificar las emociones, miedos y temores que pueden estar cau-
sando malestar en A.

R e s u lta d o s
WISC-IV (N o r m a s e s pa ñ o l a s )

PUNTUACIÓN RANGO RANGO DE


ÍNDICES
COMPUESTA PERCENTIL INTERPRETACIÓN
Comprensión verbal 116 86 Promedio alto
Razonamiento perceptual 102 55 Promedio
Memoria de trabajo 88 21 Promedio Bajo
Velocidad de procesamiento 83 13 Promedio Bajo
……………………………...… ………… ………… …………………
Puntaje Total 100 50 Promedio 33

Tabla 1. Resultados de A en las cuatro dimensiones evaluadas.

Tal como se observa en la Tabla 1, A obtuvo un puntaje total de 100,


lo que lo ubica en un rango promedio, con la probabilidad del 95 % de
que su verdadero desempeño cognoscitivo se encuentre entre 95 y
105. Lo anterior evidencia que A se encuentra dentro de la normalidad
en su capacidad de aprendizaje global y descarta la existencia de ha-
bilidades superiores.

Figura de R e y (N o r m a s E s pa ñ o l a s )
La puntuación de A en la primera fase se ubica en el percentil 90, en
la fase de reproducción de memoria su puntuación se ubica en el per-
centil 50, lo cual indica que la copia y reproducción de la figura fue casi
perfectamente conseguida y rica en detalles. Con respecto al tiempo de
copia y de reproducción se ubicó en el percentil 90, lo cual indica que es
especialmente corto para su edad, y que tan solo el 1 % de los niños de
su edad logran ejecutar la tarea en un tiempo menor. Por consiguiente, se
descarta la hipótesis sobre problemas de memoria.

Test de S t ro o p de C o lo r e s y P a l a b r a s (N o r m a s b o g ota n a s )
Este instrumento también fue aplicado en la quinta sesión para
evaluar específicamente la atención. Esta prueba se puede usar en ca-
sos muy diversos independientemente del nivel cultural de los sujetos
debido al corto tiempo que se requiere para administrarla y a la sen-
cillez de sus estímulos. Se han realizado varios estudios americanos y
españoles, sin embargo, esta prueba cuenta con baremos bogotanos,
pero no se ha realizado la corrección para edad de niños.
La puntuación obtenida por A en la lámina de palabras fue de 52,
para la lámina de colores fue de 50, y la lámina de palabras colores
arrojó 54, estas puntuaciones están ubicadas dentro del rango espe-
rable: 40-60, en una escala que va de 1 a 100; adicionalmente se en-
contró que el niño obtuvo una puntuación de 64 en interferencia, lo que
quiere decir que además de que se descarta algún problema neuropsi-
cológico en los procesos atencionales, se identificó que el niño cuenta
con una capacidad superior para producir respuestas automáticas.

C h i l d r e n ' s D e p r e s s i o n I n v e n t o r y (N o r m a s e s pa ñ o l a s )
A se ubicó en el percentil 85 para la escala de depresión total, lo
que lo ubica dentro del rango límite (muy cercano al percentil 90) de
niños sin sintomatología. Para la escala de Autoestima Negativa las
34 respuestas de A se ubicaron en el percentil 80 con una intensidad me-
dia en su autoeficacia relacionadas con la poca seguridad de que las
cosas le saldrán bien, dificultad para tomar decisiones y aspectos del
MEDIR Y EVALUAR

sí mismo que no le agradan. En la escala de Disforia el niño se ubicó


en el percentil 85, lo que indica inexistencia de patología depresiva.

Test d e lo s c u e n to s d e h a da s (N o r m a s e s pa ñ o l a s )
Para el caso de A se evidenció una baja puntuación en Autoestima =
25; altas puntuaciones en las variables de Agresión por Venganza = 69;
Temor a la Agresión = 64, que refleja una posible amenaza o miedo pre-
sentado actualmente; Relación con la Madre = 64, adicionalmente se pudo
percibir una pobre calidad en la misma debido a la exigencia y el castigo si
se desobedece; Ansiedad = 62, con temor a acontecimientos desagrada-
bles; Depresión = 64 con en sentimientos de infelicidad y soledad; y final-
mente en la Necesidad de Afecto = 65, como la necesidad de recibir amor.
Es importante aclarar que, para afectos de interpretación, los punta-
jes brutos de todas las variables se convierten en puntajes pesados, con
una media = 50 y una Desviación Estándar = 10. Los puntajes pesados que
van de 40 a 60 son considerados dentro de los límites normales.
Perfil d e l e va l u a d o
Acorde con los resultados obtenidos de las pruebas aplicadas a
A se puede determinar que: en relación con las habilidades de com-
prensión verbal, y en concordancia con el WISC-IV (Wechsler, 2005); A
expresa una alta capacidad para la formación de conceptos y expresar
relaciones entre los mismos, así mismo precisión en la definición de
palabras, demostrando agilidad e intuición verbal; posee habilidades
para la comprensión social; tiene alta capacidad de abstraer y genera-
lizar a partir de dos conceptos dados; posee amplio conocimiento léxi-
co, tiene precisión conceptual y capacidad expresiva verbal; frente a la
solución de problemas cotidianos, razona y logra emitir juicios socia-
les; adquiere, conserva y recupera conocimientos adquiridos; integra
información, genera conceptos alternativos y condensa información.
Por otra parte, en cuanto a razonamiento perceptual, A no demuestra
habilidades superiores en comparación al promedio, sin embargo según
su puntaje se puede inferir que es capaz de expresar habilidades práxicas
constructivas, formar y clasificar conceptos no verbales, hace análisis vi-
sual y procesamiento simultáneo; posee habilidades de análisis, síntesis y
organización viso-espacial durante tiempo controlado; se ubica en un nivel
promedio en cuanto a formación de conceptos y categorías a partir de ma-
terial visual; es capaz de hacer razonamientos por analogías visuales que
implica integración de información visual; así mismo posee capacidades
de reconocimiento y organización perceptiva a tiempo controlado.
A obtuvo una puntuación por debajo del promedio en memoria de
trabajo y velocidad de procesamiento, por lo cual se podría conside-
rar que existen dificultades en general con la memoria inmediata y la 35
memoria de trabajo, que implica habilidades como secuenciación, pla-
nificación, alerta y flexibilidad cognitiva; sin embargo este problema
debe considerarse muy leve atendiendo a que el puntaje en el WISC-IV
no es significativamente bajo (88), y a que los resultados observados
en la aplicación de la prueba de la Figura de Rey permiten entender
que no está fuertemente comprometida la memoria de trabajo de A,
ni su capacidad perceptiva, así como tampoco sus capacidades aten-
cionales, pues los resultados del Test de Figuras y Palabras Stroop se
encuentran dentro del rango esperado para su edad. Adicionalmente,
es necesario alertar acerca de los posibles efectos del estado afectivo
del niño sobre la validez de las puntuaciones obtenidas en el WISC-IV;
este tema se tratará con mayor amplitud en el apartado siguiente.
A partir de los resultados obtenidos es recomendable implemen-
tar un tratamiento orientado a mejorar su capacidad de retención y
almacenamiento de información, la forma de operar mentalmente con
ésta, transformarla y generar nueva información; con lo que, en una
próxima evaluación se esperaría que el consultante obtenga resulta-
dos aún más satisfactorios.
Por otra parte, de acuerdo con los resultados del CDI no hay sin-
tomatología de depresión a nivel patológico, sin embargo, el puntaje
indica que el consultante está al límite de presentarla. Esta idea se
soporta además al tomar en consideración los resultados obtenidos
en el FTT, e incluso, teniendo en cuenta la percepción del psicólogo
evaluador, a quién el niño mostraba y reportaba sentimientos de tris-
teza y desmotivación durante las sesiones.

Discusión
Debido a la gran complejidad inherente a la caracterización del fenó-
meno de la superdotación intelectual, existe en las instituciones educati-
vas la tendencia a lanzar la hipótesis de que un alumno tiene habilidades
cognitivas superiores basándose en algunos de los mitos o falsas creen-
cias existentes en relación con este tema. El asunto es más grave de lo
que podría parecer, ya que al generar en los padres falsas expectativas,
es posible que estos intensifiquen la demanda académica que hacen al
niño a tal punto que se olvidan de las necesidades y bienestar psicológico,
social y emocional. Tal es el caso de A, pues desde muy temprana edad
sus padres recibieron comentarios acerca de su posible superdotación
intelectual, por lo cual crearon un proyecto de vida para el niño enfocado
completamente en el ámbito académico.
Los resultados obtenidos a partir de las distintas pruebas son con-
sistentes en soportar el hecho de que las habilidades cognitivas de A son
normales o promedio para su edad. Sin embargo debe tenerse en cuenta
que aunque la administración de las diferentes pruebas se realizó siguien-
36 do cuidadosamente las indicaciones del respectivo manual de aplicación,
no es posible garantizar la confiabilidad de las mediciones, esto teniendo
en cuenta que se evidenció la existencia de una fuente de error no siste-
MEDIR Y EVALUAR

mático que afecta la confiabilidad y por ende la validez de los resultados


(Henson, 2001), se trata de la hora en que A asistía a sus sesiones, al final
de la tarde después de que A finalizaba su jornada académica, momento
en que el niño reportaba cansancio, tensión emocional, y preocupación
por las obligaciones escolares pendientes por realizar; por lo que su nivel
de atención, concentración y disposición podría haberse visto afectado.
Entonces, es de esperar que las puntuaciones de los diferentes compo-
nentes del test de inteligencia WISC-IV pudieron verse afectadas por el
estado afectivo del niño en el momento en que se realizó la sesión.
Por otra parte, la afirmación acerca de un alto riesgo de depresión en
el consultante, no se hace sólo con base en los resultados en instrumen-
tos aplicados como el CDI en el cual su puntuación está cercana al límite
inicial de sintomatología leve de depresión como se explicó anteriormen-
te, y el FTT que evidencia sentimientos de infelicidad y soledad, sino tam-
bién en base a las observaciones durante las sesiones, pues en el inicio de
éstas siempre se le hacen preguntas respecto a su día o sus labores y lo
que siempre relata es que sus responsabilidades académicas le impiden
un descanso suficiente, puesto que, según la percepción del niño, le lleva
mucho tiempo acabar sus tareas, por la cantidad y la extensión de las
mismas, e incluso los domingos que visita a sus abuelos tiene que buscar
espacios para terminar sus obligaciones académicas. Por otra parte, A ha
hecho varias comparaciones con quienes él llama “niños normales”, pues
argumenta que ellos sí tienen tiempo para divertirse, por ejemplo, ver te-
levisión o jugar en ciertos tiempos, algo que él no suele hacer porque no le
queda tiempo. Adicionalmente, al investigar cuáles fueron los ítems más
altos se pudo observar que son los que reportan problemas para dormir,
constante cansancio y dificultad para hacer sus deberes escolares.

Conclusiones y recomendaciones
A no posee habilidades superiores como lo sospechaban sus maes-
tros, sin embargo su nivel de comprensión verbal y de razonamiento per-
ceptual se ubican por encima del promedio, características que pueden
haber influido en la suposición hecha por los profesores.
La evaluación en el área emocional puede considerarse un eje funda-
mental de tratamiento, ya que A presenta una sobrecarga académica que
perjudica su estado de ánimo y por ende su rendimiento académico. Esta
afirmación se soporta en el análisis de los resultados obtenidos en las
pruebas CDI y FTT, y es consistente al contrastarla con los auto reportes
del niño acerca de su estado de ánimo durante las sesiones. Por otra par-
te, se debe concientizar a los padres del menor acerca de la importancia
que tiene para los niños el tiempo de ocio y descanso. 37
Las instituciones académicas, específicamente los docentes, deben
actuar con la mayor prudencia posible frente a la sospecha de un niño con
superdotación intelectual, evitando crear falsas expectativas en el menor
y en sus padres. Antes de emitir un juicio concluyente es necesario remitir
al menor a un centro de atención psicológica calificado en evaluación psi-
cológica, para que sea allí donde se hagan las pruebas pertinentes para
poder dar al niño y a su familia un informe válido y confiable.
El evaluador debe ser muy cuidadoso en el momento de reportar los
resultados evitando generar sentimientos de desilusión en el menor y/o
en sus padres, como también que el proceso de evaluación cause efectos
nocivos, por ejemplo, en este caso, donde se debe tener en cuenta que los
padres de A tenían la fuerte esperanza de confirmar que su hijo era un
niño “superdotado intelectualmente”. Es recomendable hacer una sesión
dedicada a los padres donde se les ayude a comprender la importan-
cia de tener en cuenta los deseos, anhelos y aspiraciones del niño como
agente de su propia vida, para evitar que él caiga en una patología depre-
siva mayor u otros problemas psicológicos o sociales.
Referencias
Abello, R., Amarís, M., Blanco, A., Madariaga, C., Díaz, D. & Arciniégas, T. (2008).
Bienestar, autoestima, depresión y anomia en personas que no han sido víc-
timas de violencia política y social. Investigación & Desarrollo, 16(2), 214-231.
American Psychological Association [APA]. (2014). Intelligence. Recuperado de:
http://www.apa.org/topics/intelligence/.
Ballesteros, S. (1999). Memoria humana, investigación y teoría. Psicothema, 11(4),
705-723.
Beck, A. (1974). The development of depression: A cognitive model. En: R. Fried-
man, & M. Katz (Eds.). Psychology of depression: Contemporary theory and re-
search. (pp. 3-27). Washington, D. C.: Winston-Wiley.
Binet, A. y Simon, Th. (1905). Méthodes nouvelles pour le diagnostic du niveau inte-
llectual des anormaux. L’Année Psychologique, 11(1), 191-244.
Caballo, V. (2005). Manual para la evaluación clínica de los trastornos psicológicos:
estrategias de evaluación, problemas infantiles y trastornos de ansiedad. Espa-
ña: Ediciones Pirámide.
Castello, C. & de Batlle, C. (1998). Aspectos teóricos e instrumentales en la identi-
ficación del alumnado superdotado y talentoso. Propuesta de un protocolo.
Faisca: Revista de altas capacidades, (6), 26-66.
Castro, M. L. (2012). Niños de altas capacidades intelectuales: ¿Niños en riesgo
38 social? Recuperado de: http://elblogdehiara.files.wordpress.com/2012/03/
alta-capacidad-desafiante.pdf
Consejo General de Colegios Oficiales de Psicólogos (s.f.). Evaluación del test
MEDIR Y EVALUAR

WISC-IV. Recuperado de: https://www.cop.es/uploads/PDF/WISC-IV.pdf


Coulacoglou, C. (2002). FTT, Test de los Cuentos de Hadas. Madrid: TEA Edi-
ciones S.A.
Davanzo, H. (2000). Estudio clínico inicial: (Primera entrevista). Revista chilena de
neuropsiquiatría, 38(1), 44-50.
Fernández-Ballesteros, R. (1997). Evaluación Psicológica y Test. En: A. Cordero
& Colls, La Evaluación Psicológica en el año 2000 (pp. 11-26). Madrid: TEA
ediciones, S.A.
Golden, C. (1999). STROOP Test de colores y palabras. Tea Ediciones S.A.
Guevara, B., Da Silva Nunes, C., & Borges, V. (2014). Evidências de Validade
com base na estrutura interna no teste dos contos de fadas. Psico-USF,
19(1), 107-118.
Herrera, E., Núñez, A., Tobón, S. & Arias, D. (2009). Análisis bibliométrico de la de-
presión infantil. Pensamiento psicológico, 5(12) 59-70.
Herreras, E. y Santos, J. (2006). Utilidad del Stroop en la psicología clínica. Avances en
Salud Mental Relacional, (5)1.
Kovacs, M. (2004). CDI Inventario de Depresión Infantil. Tea Ediciones S.A.
Lara, M. A., Galindo, G., Romero, M., Salvador, J. & Domínguez, M. (2003). La figura com-
pleja de Rey en adolescentes que consumen disolventes inhalables. Salud Mental,
26(6) 17-26. Recuperado de http://www.redalyc.org/articulo.oa?id=58262603
Londoño, L. (2009). La atención: Un proceso psicológico básico. Revista de la Facultad
de Psicología Universidad Cooperativa de Colombia, 5(8) 91-100.
Mora, J. A. & Martín, M. L. (2007). La escala de inteligencia de Binet y Simon (1905) su
recepción por la Psicología posterior. Revista de Historia de la Psicología, 28(2/3),
307-313.
Navarro, B. (s.f.). La Entrevista Clínica I [Presentación]. Universidad de Córdoba. Recupe-
rado de: http://www.uco.es/informacion/webs/fundacioncastilla/documentos/
archivos/formacion-residentes/la-entrevista-clinica-i.pdf
Nunes, M., Garcia, C., & Scortegagna, S. (2006). Evaluación psicológica en salud: con-
textos actuales. Estudios Sociales, 14(28), 137-161.
Paba, C., Cerchiaro, E., & Sánchez, L. (2008). Identificación de estudiantes con altas
capacidades en el Distrito de Santa Marta, Colombia. Universitas Psychologica,
7(1), 251-262.
Piqueras, J. A., Martínez, A., Ramos, V., Rivero, R., García, L., & Oblitas, L. (2008). Ansie-
dad, depresión y salud. Suma Psicológica, 15(1), 43-73.
Rey, A. (2009). Test de copia y de reproducción de memoria de figuras complejas de Rey.
9a edición. Madrid: TEA ediciones, S.A.
Rodríguez de Alba, U. & Suárez, Y. (2012). Relación entre inteligencia emocional,
depresión y rendimiento académico en estudiantes de psicología. Psicogente,
15(28), 348-359. 39
Sastre-Riba, S. (2008). Niños con altas capacidades y su funcionamiento cognitivo dife-
rencial. Revista de Neurología, 46, 11-16.
Segura, S., Posada, S., Ospina, M. L. & Ospina, H. (2010). Estandarización del inventario
CDI en niños y adolescente entre 12 y 17 años de edad, del Municipio de Sabaneta
del Departamento de Antioquia-Colombia. International Journal of Psychological
Research, 3(2), 63-73.
Sola, S. (2013). Memoria mediática y construcción de identidades. Tabula Rasa, (19),
301-314.
Thurstone, L. L. (1938). Primary mental abilities. Psychometric monograph No.1.
En: H. J. Eysenck. The Measurement of Intelligence (131-136). Chicago: Springer
Netherlands
Tribunal Nacional Deontológico y Bioético (2012). Manual deontológico y bioético del
psicólogo – Tercera versión. Recuperado de: http://www.colpsic.org.co/quienes-
somos/normatividad/20
Wechsler, D. (2005). WISC-IV, escala Wechsler de inteligencia para niños. México: Manual
Moderno.
LA INFLUENCIA DE FRANCIS
G A LT O N E N L A C O N S O L I D A C I Ó N
DE LA PSICOLOGÍA COMO
DISCIPLINA CIENTÍFICA

Fr a n c i s G a l t o n’ s i n f l u e n c e i n t h e
c o n s o l i d a t i o n o f p s yc h o l o g y a s a
scientific discipline

R esu m en
40
El presente artículo explora los inicios formati- tenido repercusión hasta el día de
vos, las influencias y el extenso trayecto académico hoy. El científico inglés, también,
MEDIR Y EVALUAR

del polímata Sir Francis Galton. Su amplio recorrido desempeñó un importante papel
investigativo le ha sido merecedor de ser reconocido en el desarrollo de la Psicología
como el padre de la Psicometría y/o la Psicología Di- Americana a través de su discí-
ferencial. Francis Galton desarrolló métodos cuanti- pulo James M. Cattell, al igual que
tativos y los aplicó en sus estudios sobre la heren- tuvo una notable influencia en el
cia, publicados en su obra Hereditary Genius (1869). trabajo investigativo de científi-
Además, el uso de test mentales, escalas de rango, cos como Spearman, Cronbach,
cuestionarios estandarizados, coeficientes de corre- Thurstone y Burt.
lación y regresión, y la aplicación de la curva de dis-
tribución normal en la medición de atributos psico-
lógicos sobre grandes muestras de individuos han Palabras clave:
sido algunos de los logros de Galton, los cuales han Francis Galton, psicología
diferencial, psicometría,
antropometría,
Leonardo Moreno Naranjo / [email protected]
Javier Rodríguez Cajamarca / [email protected]
Estudiantes de Psicología
Universidad Nacional de Colombia, sede Bogotá

A b stract
41
This article explores the formative begin- dividuals, all of them have im-
nings, influences and the broad academic path pacted psychology even these
of the polymath Sir Francis Galton. His extensi- days. British scientist also plays
ve research route gave him the recognition as an important role in the develo-
the father of psychometrics and/or Differential pment of American psychology
Psychology. Francis Galton developed quantita- through his disciple James M.
tive methods and applied them in his heredity Cattell, as a significant influence
studies published in his book Hereditary Genius on the research work of scien-
(1869). In addition, some of the greatest achieve- tists like Spearman, Cronbach,
ments of Galton are: use of mental tests, scales Burt and Thurstone..
range, standardized questionnaires, correlation
and regression coefficients and the application
of the normal distribution curve in measuring Keywords:
psychological attributes on larger samples of in- Francis Galton, differential
psychology, psychometry,
anthropometry, heritage.
La psicología, desde sus inicios, tuvo raíces en distintas discipli-
nas académicas, las cuales se interesaron en entender al ser humano
y sus facultades psicológicas. Por un lado, la filosofía de corte empiris-
ta tuvo gran interés en comprender cómo aprendemos a través de las
sensaciones e ideas, dando pautas generales de lo que sería la prime-
ra aproximación científica del estudio de las asociaciones de ideas y la
conciencia. Entre tanto, gracias al desarrollo en la ciencias biológicas
con la teoría de la evolución de Darwin, se empezó a considerar que
el ser humano estaba regido por aquellos principios evolutivos y que
solo era parte de un largo proceso de selección natural (Pueyo, 1997).
Coincidencialmente, esta teoría se interesó en el organismo hu-
mano y aportó un principio, que, aunque era evidente para muchos
pensadores de la antigüedad, le dotó de un significado funcional y/o
adaptativo: la variabilidad de la conducta. Si bien este es un postulado
general para todos los seres vivos, en los humanos cobra gran impor-
tancia ya que la gran diversidad de estilos comportamentales sugiere
que existe cierta flexibilidad en la adaptación de distintos ambientes,
esto le permitió al hombre sobrevivir y fundar civilización alrededor
del globo. Estas ideas suscitaron el interés en muchos científicos de
diferentes áreas, quienes intentaron dar sustento empírico a estos su-
puestos teóricos, e incluso darles una aplicación social.
Un primer paso para la comprensión del fenómeno de la varia-
bilidad en los humanos fue el de tomar medidas descriptivas de dis-
tintos rasgos (Galton, 1896 & Goldstein, 2012). Para este tipo de tarea,
la metodología cuantitativa era esencial al momento de condensar y
42 representar los datos obtenidos de los distintos individuos (Goldstein,
2012). Es por esto que la estadística surge como una herramienta im-
prescindible para el estudio de las diferencias individuales y, a su vez,
MEDIR Y EVALUAR

sirve de justificación empírica de las nacientes ciencias sociales a fi-


nales del siglo XIX. Es, en esta época, donde surge una de las figuras
más reconocidas en el campo de la antropometría y la psicometría: Sir
Francis Galton (Pueyo, 1997).
En este trabajo se analizarán algunos de los aportes que reali-
zó Francis Galton (Ver figura 1) en relación con la consolidación de la
nueva ciencia del comportamiento y la mente. Aunque, originalmente,
Galton no fue un psicólogo, se puede llegar a vislumbrar que tuvo un
profundo impacto en sus discípulos, especialmente, en el área de la
psicología correlacional (Cronbach, 1957). De igual modo, el afán por
aplicar sus conocimientos al sistema social llevó a Galton y a sus se-
guidores a conformar una nueva doctrina conocida como la eugenesia,
en la que la selección de rasgos ideales, sería el principio fundamental
para formar una sociedad perfecta (Godin, 2007).
Figura 1. Francis Galton (1822-1909).

Reseña Biográfica
Como se ha señalado, los múltiples aportes de Galton –Científico
inglés nacido el 16 de Febrero de 1822– ayudaron al inicio y la conso-
lidación de numerosas disciplinas, llegando a ser reconocido a los 87
años de edad –tres años antes de su muerte el 17 de enero de 1911 en
Haslemere– con el título de Sir otorgado por el Reino Británico.
Retrocediendo un poco más, ya sobre la edad de 22 años, entre
el período transcurrido desde 1844 y hasta 1864, el joven científico 43
luego de terminar sus estudios en el King's College de la Universidad
de Londres y en el Trinity College de Cambridge, se centra en estudios
geográficos y meteorológicos (Pueyo, 1997), sacando provecho de los
viajes que realizó por el continente africano, más exactamente en Sud-
áfrica (1845-46) y en Damaraland (1850). Dichas exploraciones reper-
cutirían, posteriormente, en el desarrollo de sus investigaciones sobre
las capacidades individuales al notar como destacaban ciertas pecu-
liaridades mentales en las diferentes razas; del mismo modo, los pos-
tulados teóricos de su primo Darwin ejercerían una influencia notable
al momento de abordar estos temas. Más adelante, como resultado de
estos viajes, publicaría, años después: Explorer in Tropical South Africa
(1853) y Arte de viajar (Art of Travel, 1855).
Posteriormente, entre los años 1865 y 1899, como lo señalan sus
discípulos, se dedicó a estudiar a fondo las diferencias individuales y
la relación que ocupa la herencia en este aspecto. Es así, como duran-
te estos años, específicamente en 1883, escribió Inquiries into human
faculty and it’s development, el cual, para Burt, representa la obra de
Galton más importante para la psicología, donde se analizan las dife-
rencias individuales en la personalidad, como efecto conjunto de dos
factores distintos aunque complementarios: Natura (factores biológi-
cos) y Nurture (factores ambientales) (Pueyo, 19997).
Así pues, gracias a los estudios que desarrolló con gemelos, Gal-
ton concluye, en esta obra, que los factores Natura cobran más rele-
vancia sobre los Nurture cuando las diferencias en los factores am-
bientales no exceden las diferencias de crianzas normales que tienen
las personas que pertenecen a un mismo nivel social (Pueyo, 1997).
Luego, durante este mismo período, en 1875, Galton hace pública su
teoría de la herencia; a su vez, en 1884, pone en funcionamiento el
primer laboratorio de psicología experimental en Inglaterra, enfoca-
do en la antropometría (Ver figura 2); allí, trabajaría con J. M. Cattell
(Ver Imagen 3) y, en 1889, publicarían los análisis de los resultados
obtenidos, con el fin de sustentar su teoría de la herencia que, en años
posteriores, sería rechazada.

44
MEDIR Y EVALUAR

Figura 2. Portada de Figura 3. James Mackeen


Hereditary Genius (1869). Cattell (1860-1940).

Por último, algunos autores señalan una etapa final entre 1900
y 1911, caracterizada por la dedicación a la eugenesia de la que ya
hemos hecho mención y su esmero por establecer modelos aplica-
dos de sus investigaciones (Pueyo, 1997). Con todo, Sir Francis Galton,
conocido como el padre de la estadística psicológica o psicometría,
realizó aportes esenciales en el desarrollo de técnicas para el estudio
de las diferencias individuales, test mentales, escalas de rango, cues-
tionarios estandarizados, coeficientes de correlación y regresión, y la
aplicación de la curva de distribución normal (Burt, 1962).
M e to d o lo g í a en el trabajo de G a lt o n
Resulta notable, en los trabajos empíricos de Galton, su interés
por la precisión de sus datos, considerando que él mismo fue pionero
en el uso de distintos métodos estadísticos para estudiar diferentes
variables asociadas a las capacidades del hombre, tanto físicas como
mentales. En su obra más importante, Hereditary Genius (1869) (Ver
figura 4), Galton describe una serie de procedimientos estadísticos
para dar sustento a su teoría de la heredabilidad de las habilidades
naturales del hombre. Para ello, consideró distintas variables que le
permitieran cuantificar esos “dones” naturales del hombre, entre esas
variables tuvo en cuenta el nivel de reputación como indicador de bue-
nas habilidades de carácter heredable. Por esta razón, Galton usó una
muestra de distintos grupos sociales, entre los que se encontraban
jueces, estudiantes y profesionales de otras áreas.

45

Figura 4. Laboratorio de Antropometría de Francis Galton.

Ahora bien, la reputación no solamente consta del reconocimiento


público; por eso, Galton tuvo en cuenta una lista de variables en la que los
hombres se pudieran considerar ilustres; en primer lugar, postuló que la
eminencia se podía medir en cuanto a una proporción de “un hombre en
un millón” (Galton, 1869); de igual manera, empleó un test de habilidad
para confirmar sus sospechas y, de esta manera, poder usar la ‘eminen-
cia’ como criterio para evaluar los dones naturales. Para recoger este tipo
de datos, lo haría examinando la vida profesional y social de los partici-
pantes de su estudio y estimaría este indicador según la proporción de
méritos obtenidos por cada individuo.
Por otra parte, Galton utilizó otro criterio de clasificación, el cual
consistió en evaluar a los hombres por sus dotes naturales. En este
aspecto, Galton menciona que las formas de clasificar que se habían
venido usando son ineficientes, dado que, de antemano, presentan
una pretensión de equidad natural entre los hombres. Aunque Galton
acepte, en parte, que existe una gran influencia de la educación y del
poder de la práctica en el desarrollo de las habilidades mentales, él
afirma que existe un máximo rendimiento, el cual es cuantificable y
no puede superarse con la práctica de estas habilidades. De igual ma-
nera, sugiere que las habilidades están limitadas a pocos dominios
donde los hombres alcanzan gran reputación, en otras palabras, es-
tipula que existen diferencias intelectuales y que la preferencia por
un dominio determinará la forma en que se explotan las habilidades
naturales, esta última característica, afirma él, está presente en los
genios. Igualmente, Galton, al revisar datos estadísticos sobre califi-
caciones de estudiantes universitarios, sugiere que la inteligencia ma-
nifiesta cierta tendencia a la media, esbozando, así, la idea de que la
inteligencia presenta una distribución normal, adelantándose, en este
sentido, a los científicos de su época.
Para comprobar sus hipótesis sobre la teoría de la heredabilidad
del ingenio, partiendo de un estudio inductivo (estadístico), Galton es-
cogió una muestra por conveniencia de ingleses y sus redes familia-
res; pero, debido a la enorme diversidad de intelectos ingleses, decidió
clasificar a los hombres de acuerdo con sus habilidades naturales, po-
niéndolos en clases separadas con igual grado de ‘mérito’. El méto-
do que Galton utilizaría, sería pionero en los estudios de inteligencia,
puesto que se basaría en la aplicación de varios constructos estadís-
ticos derivados de la ley de desviación a la media; esta metodología
46 sería predecesora de los modernos análisis estadísticos sobre dife-
rencias individuales e, incluso, tendría influencia sobre la creación de
diseños experimentales en psicología básica.
MEDIR Y EVALUAR

Asimismo, desarrolló las nociones básicas de correlación entre va-


riables, pues, en su estudio trató de identificar y relacionar las medidas
de las características de padres e hijos, este aspecto es esencial para
comprender la manera en que Galton esperaba demostrar sus hipó-
tesis sobre la herencia, además de dar paso a todo un desarrollo téc-
nico sobre pruebas de correlación y análisis de regresión estadística
(Goldstein, 2012). También es pertinente mencionar que Galton consi-
deró varios sesgos que pudieran surgir durante sus estudios; el más
importante consistía en que era posible que él estuviera sesgado por su
teoría y, así, solo buscaría datos que la validarán; sin embargo, él apeló
que sus pruebas estadísticas eran imparciales y presentaban pequeños
márgenes de error, en otras palabras, confiaba plenamente en la preci-
sión de sus mediciones, ya que, por experiencia, sabía de la eficacia de
las pruebas estadísticas aplicadas en contextos sociales (Galton, 1869).
La i m p o r ta n c i a d e l a ta x o n o m í a e n s u s i n v e s t i g a c i o n e s
Dentro de sus estudios, como ya lo hemos esbozado, Galton se
enfrentó a la necesidad de medir las variables para que sus poste-
riores análisis tuvieran la rigurosidad necesaria y se consideraran
factibles. Por ello, una vez iniciado su trabajo acerca de la heredabili-
dad del ingenio (plasmado en su obra Hereditary genius en 1869), con
cerca de 300 familias, el científico británico empezó a clasificarlas
de acuerdo con su rango de parentesco y sus profesiones. Entre es-
tas familias, Galton identificó 977 hombres eminentes, dentro de los
cuales denominó ilustres a 415, debido a que poseen características
cognitivas superiores, al igual de contar con reconocimiento en su
campo. En este punto, hay que señalar que Galton decidió no incluir
hombres eminentes de los cuales no logró obtener mayores datos de
sus familias.
Los grados familiares con los que contó Galton en su estudio se
agruparon, inicialmente, con el padre; luego con el hermano, el hijo, el
abuelo, el tío; en seguida, con los sobrinos, los nietos, el bisabuelo, el
tío abuelo, el primer primo, el sobrino nieto, el bisnieto; en una última
casilla, incluyó a todos los demás. Siguiendo con su clasificación, el
investigador británico seleccionó 8 profesiones notables de su época
y las puso en un mismo plano, sin ningún grado de relevancia una
de la otra. Las profesiones seleccionadas fueron: jueces, estadistas,
comandantes, literatos, científicos, poetas, artistas y teólogos.
Una vez tabulados los datos, Galton identifica que, independien-
temente, de la profesión de los hijos, hay un mayor número de in-
dividuos eminentes que en los grados de padres y hermanos (con 47
particularidad en los comandantes), ese mismo descenso sigue por
debajo del grado de hijo, aun cuando, en la categoría de tercer grado,
los sobrinos, en todas las profesiones, exceptuando a los teólogos,
logran tener la tasa más alta de eminencia dentro de los familiares
de tercer grado o más (Galton, 1869).
Posteriormente, Galton analizó, en su libro, algunos casos llama-
tivos en su diagrama de datos e indagó las posibles causas de estos.
Por ejemplo, señala el caso en el que resulta haber pocos hijos emi-
nentes en la profesión de comandante; esto lo resuelve arguyendo
que dentro de la vida militar es mucho más difícil conseguir pareja y,
por tanto, generar descendencia. No obstante, se muestra un hecho
interesante: no se presenta una variación notable con respecto a las
otras profesiones en el grado de nietos; esto se debe, según el cien-
tífico inglés, a que la superioridad de raza de los altos militares en el
ejército, pese a tener pocos hijos, estos logran tener descendencia
que, en su mayoría, logra ser eminente.
A su vez, explica la razón por la cual, según él, hay un número
mucho mayor de hijos eminentes (60) en relación con la cantidad de
padres con igual grado (26) en la profesión científica; esto se debe a
que, inicialmente, el primer hombre de ciencia en la familia no proyec-
ta mayores posibilidades de llegar a ser eminente y, por tanto, solo se
dedica al ámbito formal y profesional de su cargo. Otro dato particular,
explicado por Galton, es el de los artistas que muestran altos índices
de eminencia en la categoría de hermanos e hijos; esto representa un
dato clave para sugerir que el talento es heredado y se potencializa
con la preparación profesional (Galton, 1869).
Siguiendo con sus conjeturas, Sir Francis Galton menciona que la
capacidad que tienen los hombres eminentes para conseguir pareja es
notable puesto que, al parecer, se relacionan con su equivalente feme-
nina, refiriéndose a las potenciales capacidades cognitivas, afectivas y
conativas. Igualmente, menciona a los hombres cuyas capacidades fí-
sicas o sociales no son las mejores y que no logran tener descendencia
con una mujer de buenas capacidades, quizás, por la misma razón de
que sus rasgos son débiles. Sin embargo, Galton encuentra que algu-
nos genios no generan descendencia, posiblemente, por la dedicación
total a su trabajo o, incluso, como lo sugiere Prosper Lucas (Galton,
1869), sobre la infertilidad de los de prodigioso intelecto haciendo una
comparación entre los gigantes y los enanos que, de igual manera, no
se ven regularmente en la sociedad. De esta manera, Galton propone
un trabajo pionero que se convertiría en un hito del estudio científico
de las diferencias individuales (Godin, 2007).
48
El legado de G a lt o n : e l pa p e l d e C at t e l l en la confor-
mación de la P s i c o lo g í a A m e r i c a n a
MEDIR Y EVALUAR

El trabajo de Galton suscitó la fascinación de muchos investigado-


res alrededor del mundo, incluso aunque su interés inicial no estaba
enfocado en la nueva ciencia psicológica, sus estudios tuvieron gran
impacto en la concepción de las habilidades mentales y las diferencias
individuales (Eysenck, 1947; Cronbach, 1957; Pueyo, 1997; Goldstein,
2012). Por un lado, otorgó, a varios investigadores, la metodología ne-
cesaria para adelantar sus estudios y comprobar sus hipótesis de ma-
nera precisa; además de identificar, cuantificar y medir variables de
carácter psicológico, las cuales apenas estaban cobrando importancia
en la naciente psicología científica. De igual forma, gracias a la obser-
vación de correlaciones entre las variables que tuvo en cuenta en sus
estudios, pudo inferir ciertas variables latentes, las cuales indicaban
que existía algún factor relevante que intervenía en la variación de sus
medidas. Bajo estas ideas, Spearman (1904) propone un nuevo mode-
lo estadístico para estudiar la estructura de las facultades mentales.
Este modelo fue conocido como el análisis factorial, que, a su vez, se
convertiría en el modelo estándar del estudio de las diferencias indi-
viduales, aplicado tanto para analizar la personalidad (Cattell, 1957;
Eysenck, 1947) como para examinar la inteligencia (Spearman, 1904;
Thurstone, 1924; Guildford, 1967).
Si bien el trabajo de Galton atrajo la atención de muchos inves-
tigadores sociales, uno de sus seguidores prolongaría su legado en
Norteamérica y continuaría su trabajo desde la psicología diferencial;
se trató de James Mckeen Cattell, quien, gracias a sus experiencias
con Galton, logró introducir nuevas técnicas estadísticas y de medi-
ción objetiva en la naciente psicología americana, además de acuñar
el concepto de test mental (Pueyo, 1997). Cattell también es conoci-
do como el más grande divulgador de la obra de Galton en América,
así como un férreo defensor de sus ideas eugenésicas, promoviendo
el uso de distintos métodos objetivos para evaluar la “calidad” de los
hombres (Godin, 2007). De igual manera, Cattell promovió la imagen
de la psicología como disciplina objetiva, ya que él creía que los mé-
todos cuantitativos son una pieza clave para comprender la mente
humana, más allá de los métodos introspeccionistas reinantes de su
época (Cattell, 1917).
Dentro de su trabajo investigativo, Cattell continuó realizando
estudios estadísticos sobre capacidades mentales; en este aspecto,
desarrolló una investigación con científicos americanos siguiendo la
tradición galtoniana sobre estudios de grandes poblaciones (Cattell,
1906); en este estudio, Cattell recopiló información de cerca de 4000
científicos americanos de su época de las más variadas disciplinas, 49
incluyendo los criterios de reputación (nivel de formación, número de
publicaciones, pertenencia a comunidades académicas, méritos, etc.)
para seleccionar su muestra de científicos, de modo similar a los pro-
cedimientos que realizó Galton en Hereditary Genius (1869). A través de
esta investigación se reveló la distribución de científicos en diferentes
áreas académicas logrando, también, identificar el desempeño de los
hombres de ciencia en cuanto a sus profesiones (Cattell, 1906).
Además de aportar nuevos hallazgos a la reciente disciplina psico-
lógica, Cattell tuvo un papel esencial en la divulgación y acreditación de
esta nueva ciencia, en parte, gracias a que colaboró en la fundación de las
revistas Science y Psychological Review; igualmente, era miembro activo
de la American Psychological Association. Su labor no solo se reducía a la
divulgación sino que él creía que la psicología científica debería tener un
papel preponderante en las distintas áreas de la vida social, empezando
por la reformulación de la educación y la selección de estudiantes aptos
para cada profesión por medio de métodos objetivos y científicamente
reconocidos (Cattell, 1917; Pueyo, 1997; Goldstein, 2012).
C o m e n ta r i o s finales
La vida y obra de Sir Francis Galton, a pesar de estar sometido a
diferentes controversias, especialmente por su relación con la euge-
nesia, no para de representar un gran avance en la ciencia del siglo
XIX. La visión de Galton fue esencial en la aplicación de los métodos
estadísticos que usó en sus investigaciones sociales; de igual mane-
ra, no solo se restringió a sus constructos metodológicos, sino que
creó todo un cuerpo teórico acerca de las diferencias individuales, he-
cho que dominaría el interés de muchos investigadores alrededor del
mundo, especialmente de los psicólogos diferenciales. Por esta razón,
el aporte de Galton resulta inconmensurable, en la forma en que dotó
de métodos lo suficientemente precisos a una ciencia que apenas es-
taba acreditándose en la comunidad académica.
Igualmente, gracias a que algunos seguidores continuaron su le-
gado científico, se logró desarrollar toda una serie de métodos cuanti-
tativos para medir las diferencias individuales, los cuales, actualmen-
te, gozan de una alta precisión y son reconocidos en los distintos cam-
pos de la psicología aplicada y la psicometría. Así pues, para entender
la contribución de Galton a la psicología, es necesario comprender
tanto su legado, como el papel de sus discípulos, quienes continuaron
su trabajo después de su muerte.

50
MEDIR Y EVALUAR
Referencias
Burt, C. L. (1962). Francis Galton and his Contributions to Psychology, British
Journal of Statistical Psychology, 15(1), 1-49.
Cattell, J. M. (1906). A statistical study of American men of science. The selec-
tion of a group of one thousand men. Science 24, (621), 658-665.
Cattell, J. M. (1917). Our psychological association and research, Science,
45(1160), 275-284.
Cronbach, L. J. (1957). The two disciplines of scientific psychology. American
Psychologist, 12, 671-684.
Eysenck, H. J. (1947). Dimensions of Personality. Londres: Paul Kegan,Trench,
Trubner & Co. Ltd. 51
Galton, F. (1869). Hereditary Genius. Londres: Macmillan & Co.
Gardner, H. (1983). Frames of mind: The theory of multiple intelligences. Nueva
York: Basic Books.
Godin, B. (2007). From eugenics to scientometrics: Galton, Cattell, and men of
science. Social studies of science, 37(5), 691-728
Goldstein, H. (2012). Francis Galton, measurement, psychometrics and social pro-
gress. Assessment in Education: Principles, Policy & Practice, 19(2), 147-158.
Guilford, J. P. (1967). The nature of human intelligence. Nueva York: McGraw-Hill.
Pueyo, A. (1997). Manual de psicología diferencial. México: McGraw-Hill.
Spearman, C. (1904). ‘General intelligence’ objectively determined and measured.
American Journal of Psychology 15(2), 201-293.
Thurstone, L. L. (1924/1973). The Nature of Intelligence. London: Routledge.
E S T U D I O E X P E R I M E N TA L D E
LA RELACIÓN ENTRE LA
VA L E N C I A Y E L R E C O B R O D E
IMÁGENES EN UN GRUPO DE
E S T U D I A N T E S U N I V E R S I TA R I O S

Experimental study of the


relationship between the
valence and recall of pictures
in a group of college students

R esu m en
52
En el presente artículo, se intenta encon- pruebas estadísticas realizadas
trar mayor evidencia acerca de la relación entre simultáneamente sobre un con-
MEDIR Y EVALUAR

la valencia de las imágenes (positiva, negativa y junto de datos.), ya que no se cum-


neutra) y el recobro de las mismas. Se empleó un plió el supuesto de normalidad, el
diseño experimental intrasujeto, con una muestra cual dio como resultado que las
de 30 personas (14 hombres y 16 mujeres) entre imágenes de valencia negativa y
los 18 y los 26 años, con una edad media de 20,51, neutra fueron significativamente
a los que se les aplicó una batería de imágenes más recordadas que las de valen-
de diferente valencia, con una posterior prueba cia positiva. Estos resultados con-
de reconocimiento. En cuanto al análisis de datos, cuerdan con la bibliografía encon-
se utilizó el test de Friedman con la corrección trada, sin embargo es necesario
Bonferroni (Técnica estadística que ajusta el ni- controlar más variables para ob-
vel de significación en relación con el número de tener resultados más confiables.

Palabras clave:
memoria, emoción,
valencia, recobro.
Estefanía Bedoya Lozano / [email protected]
Pablo Castrillón Camacho / [email protected]
Wilson M. Madariaga Calderón / [email protected]
Valentina Umaña Arenas / [email protected]
Estudiantes de Psicología
Universidad Nacional de Colombia, sede Bogotá

A b stract
53
The present article attempts to clarify the lity assumption was fulfilled,
relationship between picture valence (positive, the result of which was that the
negative and neutral) and the recall thereof. A images of negative and neu-
within-subject experimental design was used tral valence were significantly
with a sample of 30 people (14 men and 16 wo- recall in greater degree than
men) between 18 and 26 years, with a mean age positive valence. These results
of 20.51, to which were applied a set of images of are consistent with the literatu-
different valence, with a subsequent recognition re found, however is necessary
test. For analysis of data the Friedman test with to control more variables to ob-
Bonferroni correction was used since no norma- tain more reliable results.

Keywords:
memory, emotion,
valence, recall.
Desde hace varios años, en el campo de la neurociencia cogni-
tiva, se ha venido trabajando la relación existente entre la memoria
y la emoción, y la manera como esta última puede influir en el des-
empeño de las tareas de aprendizaje y en el recuerdo de eventos
de la vida cotidiana.
La memoria puede ser considerada como un mecanismo adap-
tativo, funcional en la supervivencia de los organismos, pues evita
conductas de riesgo y permite la rápida reacción en situaciones de
peligro (Yegiyan & Yonelinas, 2011). Paralelamente, para efectos del
presente trabajo, se entenderá como emociones a ciertos estados
perceptivos manifestados, que podrán ser de placer o displacer, los
cuales siempre irán acompañados de respuestas biológicas y cog-
nitivas (Aguado, 2002). Con respecto a la memoria emocional, esta
se define como el resultado de la adquisición, almacenamiento y
evocación de la huella emocional producida en un suceso determi-
nado (Cahill & McGaugh, 1998). También puede ser entendida como
un producto del almacenamiento de la información que está acom-
pañada por factores de alarma o alerta, los cuales permiten una
mejor consolidación de dicha información en la memoria (Justel,
Psyrdellis & Ruetti, 2013).
Dolcos, Labar y Cabeza (2004) estudiaron el recobro de imáge-
nes en función de su grado de activación emocional y descubrieron
que las imágenes que son más activantes, independientemente de
su valencia, se recobran mejor que las imágenes neutras. Y dentro
de las imágenes altamente activantes, se ha encontrado que la in-
54 formación negativa se recuerda mejor. Es posible que la distinción
esté relacionada con la zona cerebral que codifica la información,
pues las imágenes de contenido negativo se asocian con regiones
MEDIR Y EVALUAR

de procesamiento sensorial como la corteza visual y el giro fusi-


forme. En contraste, la codificación de imágenes positivas se re-
laciona con la corteza prefrontal lateral y las regiones temporales
asociadas al procesamiento de información semántica y conceptual
(Yegiyan & Yonelinas, 2011).
Una posible explicación de lo anterior, radica en el hecho de
que, detectar lo antes posible un peligro y reaccionar ante él, es
fundamental para la supervivencia, pues los eventos evolutivamen-
te más significativos, como los relacionados con amenaza y peligro,
deben ser prioritarios en el procesamiento. (Gordillo et al., 2010).
Respecto a los contenidos positivos, la literatura no es tan cla-
ra, ya que se ha encontrado que estos son mejor recordados que
los neutrales, mas, en menor medida, en comparación con la infor-
mación negativa (Yegiyan & Yonelinas, 2011).
Como se puede observar, distintos autores han obtenido resul-
tados contradictorios. Estas diferencias podrían explicarse por la
metodología utilizada en cada uno de los experimentos y las varia-
ciones en los componentes de la tarea experimental, los cuales tie-
nen que ver con la manera como se presenta el estímulo, el tipo de
codificación que se espera y los tiempos de exposición y retención
de la tarea (Gordillo et al., 2010).
Así mismo, el efecto de la emoción sobre la memoria puede variar
según el tiempo que pasa desde que el sujeto codifica la información
hasta que la recupera (Quevedo et al., 2003). Por ejemplo, periodos
de retención cortos han sido poco documentados, pues la principal
dificultad es la presentación del efecto techo, el cual hace referencia a
que la tasa de aciertos es tan elevada que no es posible distinguir si es
por efecto de la valencia de la información o por el corto tiempo que ha
transcurrido entre la fase de exposición y la de recuperación.
Igualmente, la manera como se pide que sea recuperada la in-
formación influye en los resultados, pues, en tareas de recuerdo
libre, se ha evidenciado una tendencia a recordar mejor los estí-
mulos y acontecimientos negativos, y con menor frecuencia los po-
sitivos y los neutros. Sin embargo, en tareas de reconocimiento,
los resultados parecen menos claros. Algunas investigaciones que
ponen a prueba la discriminación entre imágenes poco agradables
e imágenes agradables, no encuentran una diferencia significativa
(Gordillo et al., 2010), mientras que otros encuentran mayor discri-
minación en imágenes desagradables y otros para las agradables.
Por otro lado, al estudiar el recobro de la información negativa, 55
también se ha estudiado su fragilidad, debido a su papel influyente
en la aparición de falsas memorias. Esta fragilidad y capacidad de
recobro de la información negativa se ha llamado hipótesis paradó-
jica de la emoción negativa (Porter, Spencer & Birt, 2003). Además,
se ha planteado el paradigma de la desinformación (misinformation
paradigm), el cual se refiere a la disminución de la precisión del re-
cobro en la memoria, inducido por la presentación de información
engañosa; esto explica el poder de la sugestión en el recobro (Van
Damme & Smets, 2014).
El paradigma de la desinformación se compone de tres fases. La
primera consiste en que los participantes observan un evento (pa-
labras, imágenes, videos). Posteriormente, en una segunda fase, los
participantes son expuestos a información engañosa acerca del even-
to antes observado (palabras, imágenes, videos o preguntas que agre-
gan información similar pero no igual a la ya expuesta). Por último, en
la tercera fase, se les presenta a los participantes una prueba de me-
moria sobre los eventos inicialmente presentados. Este poder suges-
tivo de la nueva información puede llegar a implantar falsos recuerdos
de eventos completos (Frenda, Nichols & Loftus, 2011).
Paralelamente, se ha observado en estudios fisiológicos, que du-
rante las situaciones con alto contenido emocional, se liberan hor-
monas adrenales, tales como la adrenalina y los glucocorticoides,
los cuales pueden afectar, de manera diferencial, el desempeño en
las tareas de aprendizaje, dependiendo del momento en que sean se-
gregadas tales hormonas. Por ejemplo, inmediatamente después del
entrenamiento, la aplicación de estas hormonas, facilita la memoria
de eventos emocionalmente significativos; inversamente, los gluco-
corticoides aplicados antes de la prueba de retención o de recobro,
deterioran la recuperación o evocación de la información previamente
adquirida (Ruetti, Mustaca & Bentosela, 2008).
Por consiguiente, la respuesta emocional puede ser incitada
por medio de dos vías paralelas: una vía de acceso rápido, conocida
como la vía simpático-adrenal-medular (SAM), donde el hipotála-
mo desencadena la activación de las glándulas adrenales (particu-
larmente la región medular de dichas glándulas), liberando así las
mencionadas catecolaminas en sangre. Por otra parte, la vía hipo-
tálamo-pituitaria-glándulas adrenales (HPA), genera un aumento,
por parte del hipotálamo, de la liberación de la hormona liberadora
de corticotrofina y arginina vasopresina, las cuales aumentan, en la
hipófisis, la producción de drenocorticotrofina en la circulación del
cuerpo humano. Esta última actúa sobre la corteza de las glándulas
56 adrenales, induciendo la síntesis y liberación de glucocorticoides,
en particular del cortisol, los cuales, como se mencionó anterior-
mente, facilitan o deterioran el recuerdo de eventos emocional-
MEDIR Y EVALUAR

mente significativos (Justel, Psyrdellis & Ruetti, 2013).


En estudios con animales, se han obtenido resultados simila-
res, que demuestran que el estrés puede afectar la función hipo-
campal, impidiendo la consolidación de la memoria a largo plazo; lo
anterior podría explicar el bajo reconocimiento de fotografías con
niveles de activación muy altos, debido al estado de estrés gene-
rado en los sujetos, el cual tiene repercusiones en la memoria y se
hacen evidentes en la fase de recuperación de la información (Gor-
dillo et al., 2010). Adicionalmente, se ha relacionado a la amígdala
con la integración de la información sensorial acerca de estímulos
emocionalmente significativos, a través de rutas corticales y sub-
corticales de procesamiento, mediante las cuales se elaboran re-
acciones defensivas integradas a estímulos aversivos a través del
control de centros de respuesta autonómica y motora. Algunas de
estas rutas corticales y subcorticales, integran el hipocampo y, en
general, los lóbulos frontales que son importantes para la adquisi-
ción y supresión de asociaciones de miedo (Labar, 2007).
Adicionalmente, cabe resaltar que este estudio es pertinente dado
que busca esclarecer la relación existente entre la valencia de las imá-
genes y el recuerdo posterior, ya que la literatura es contradictoria en
cuanto a los resultados encontrados en experimentos anteriores.
De acuerdo con toda la información presentada, se busca iden-
tificar el efecto del contenido de una serie de imágenes en la conso-
lidación de la memoria emocional, haciendo uso de una batería de
imágenes categorizadas según su valencia, la cual puede ser posi-
tiva, negativa o neutra mediante una prueba de reconocimiento, la
cual evalúa la cantidad de respuestas correctas según la valencia
de la imagen. Se espera que las imágenes de valencia negativa sean
significativamente más recordadas que las positivas y las neutras.

M é to d o
P a r t i c i pa n t e s
En este estudio participaron 30 estudiantes de la Universidad
Nacional de Colombia de diferentes carreras (14 hombres y 16 mu-
jeres) entre los 18 y los 26 años, con una edad media de 20,51.

I n s t ru m e n to s
Para medir la variable dependiente (número de imágenes re-
cordadas por cada valencia) se utilizó el Test de discriminación de
imágenes con contenido emocional construido por los autores del
presente artículo, el cual consiste en la presentación de 30 imáge- 57
nes (10 negativas, 10 positivas y 10 neutras) ; luego se realiza una
prueba de distracción de tres ítems; por último, se presenta una
prueba de reconocimiento con 60 imágenes1¹.

P ro c e d i m i e n to
Primero, se realizó un diseño intrasujeto en el cual se tomó como
variable independiente la valencia de las imágenes, ya sea positiva,
negativa o neutra; y como variable dependiente se mide el número de
aciertos en el recobro de imágenes de cada valencia, en una prueba
de reconocimiento.
Con el fin de poder atribuir el resultado de las mediciones a la mani-
pulación de la variable independiente, se controlaron algunas de las va-
riables que podrían afectar el resultado del experimento; estas se mues-
tran en la Tabla 1, junto con el método que se utilizó para su control.

1 Ver Anexo 1. Media de las imágenes escogidas de la prueba piloto, ubicada en los
apéndices del artículo.
VARIABLE A CONTROLAR MÉTODO DE CONTROL
Efecto de primacía y recencia Control mediante aleatorización

Tiempo de exposición Fase de exposición: 3 segundos.


de las imágenes Fase de reconocimiento: 4 segundos.

Orden de presentación Aleatorización por bloques de


de las imágenes las imágenes.

Tabla 1. Variables controladas en el experimento.

Con anterioridad y con el fin de escoger las imágenes que se


iban a utilizar en el experimento, se realizó una prueba piloto don-
de se presentó, a 30 participantes, una batería de 60 imágenes de
forma aleatoria; posteriormente, se les pidió que calificaran cada
imagen dentro de una escala de 1 a 5, donde 1 era “negativo” y 5
“positivo” y los puntajes intermedios, “neutro”. De este modo, se
hizo una selección final de las 30 imágenes que representaran me-
jor cada valencia.
Posteriormente, con los datos de la prueba piloto se desarrolló
el instrumento Test de discriminación de imágenes con contenido
emocional, el cual consta de 3 fases; en la primera se le presentó a
los sujetos las 30 imágenes escogidas en la prueba piloto (10 posi-
tivas, 10 negativas y 10 neutras) de manera aleatoria con una expo-
sición de 3 segundos por cada imagen. Posteriormente, en la fase
de distracción, se les pidió a los participantes que realizarán tres
58 ejercicios de razonamiento por un periodo de cinco minutos. Final-
mente, en la fase de reconocimiento, se le pidió a los participantes
que identificaran, dentro de una presentación de 60 imágenes, cuá-
MEDIR Y EVALUAR

les de estas fueron presentadas en la primera fase del experimento


y cuáles no aparecieron previamente.

R e s u lta d o s
En el análisis, no se cumplieron los supuestos de normalidad,
por ello se usó la prueba de Friedman, con el fin de indagar si exis-
ten diferencias de medias entre el recobro de imágenes de valencia
positiva, negativa y neutra. Como no existen pruebas post hoc para
el estadístico de Friedman, se usó la prueba de Wilcoxon, la cual
permite comparar la mediana de los grupos para mirar si hay algún
tipo de diferencias; esta, a su vez, se extendió con la corrección
de Bonferroni, método estadístico que nos permite hacer compara-
ciones múltiples, las cuales, para la presente investigación, serán:
negativa, neutra y positiva.
Se tomaron en cuenta los aciertos en la calificación de la prueba,
con lo cual se obtuvo = 47.5097, con un p= 0,0165 en la prueba de Fried-
man, concluyendo que existe diferencia entre, al menos, un par de grupos;
por tanto, se procede con la comparación mediante la prueba de rangos
signados de Wilcoxon corregida según el método de Bonferroni, es de-
cir, usando un valor real de alfa de 0,05/3 = 0,01666667 (en vista de que
son 3 pruebas de hipótesis por pares de grupos). Para la comparación
entre las parejas de variables “valencia positiva”-“valencia negativa” (se
encontró una p = (0,0189/3) = 0,0063 < 0,01666667, concluyendo que no
hay igualdad entre las variables.), “valencia positiva”- “valencia neutra” (se
encontró una p = (0,0102/3) = 0,0034 < 0,01666667, concluyendo que no
hay igualdad entre las variables) y “valencia negativa”-”valencia neutra”
(se encontró una p = (0,4118/3) = 0,13726667 > 0,01666667, concluyendo
que si hay igualdad entre las variables). A partir de los resultados expues-
tos, se concluye que existe mayor recobro de las imágenes negativas y
neutras que de las positivas.

Discusión
El objetivo principal de esta investigación fue comprobar la in-
cidencia que tiene la valencia de las imágenes en el recuerdo pos-
terior, en una prueba de reconocimiento. La hipótesis planteada
de que las imágenes de valencia negativa son más recordadas. Se
encontró evidencia que sustenta la hipótesis planteada de que las
imágenes de valencia negativa son más recordadas. De igual modo,
se constituye como un aporte para el campo de la psicología del
consumidor, puesto que arroja luces sobre qué tipo de contenidos 59
son mejor recordados por las personas, posterior a su exposición;
esto puede ser útil en el diseño de pautas publicitarias.
Diversos autores han reportado resultados similares, respecto al
mayor recuerdo de las imágenes negativas (Gordillo et al., 2010; Ken-
singer & Corkin, 2003; Mikels, Larkin, Reuter-Lorenz & Carstensen,
2005; Ochsner, 2000). Así mismo, otros autores han encontrado un
mayor recuerdo de imágenes neutras, en condiciones experimentales
similares (Gordillo et al., 2010; Fernández-Rey & Redondo, 2007).
Estos resultados podrían entenderse a la luz de la perspectiva
evolucionista, ya que se procesan más rápidamente las imágenes
negativas, pues los estímulos relacionados con amenaza y peligro,
deben ser prioritarios por su importancia en la supervivencia (Gordi-
llo et al., 2010); esto podría ser útil en el diseño de campañas publi-
citarias con énfasis educativo, las cuales podrían hacer uso de imá-
genes negativas a fin de disminuir conductas riesgosas, tales como
manejar a altas velocidades o conducir en estado de embriaguez.
Adicionalmente, es importante tener en cuenta que esta inves-
tigación se realizó con participantes jóvenes (18 a 26 años); por lo
tanto, los resultados deben ser interpretados en relación con las
características de este grupo etario, teniendo en cuenta que otras
investigaciones han reportado que en la vejez, es mayor el recobro
de información positiva (Lockenhoff & Carstensen, 2004). Esto pue-
de ser de relevancia para el diseño de campañas de salud pública
que vayan enfocadas a resaltar diverso tipo de información, según
el grupo de edad al que se dirija.
En posteriores estudios, es importante tener en cuenta que,
dependiendo del tipo de información, ya sean imágenes o palabras,
puede variar la calidad del recuerdo y su posterior recuperación.
Igualmente, hay que considerar la manipulación de otras variables,
como la prolongación de los tiempos de retención y consolidación
para encontrar resultados más confiables. De igual modo, se su-
giere abarcar un número más amplio de personas de diversas eda-
des, para poder generalizar los resultados y tener la posibilidad de
hacer comparaciones entre grupos etarios.

60
MEDIR Y EVALUAR
Referencias

Aguado, L. (2002). Cognitive processes and emotional brain systems. Revista


de Neurología, 34 (12), 1161-1170.
Cahill, L. & McGaugh, J. L. (1998). Mechanisms of Emotional arousal and lasting
declarative. Memory Trends in Neurosciences, 21 (7), 294-299.
Dolcos, F., Labar, K. S. & Cabeza, R. (2004). Interaction between the amygdala
and the medial temporal lobe memory system predicts better memory
for emotional events. Neuron, 42(5), 855-863.
Fernández-Rey, J. & Redondo, J. (2007). Recognition memory for pictorial sti-
muli: biasing effects of stimulus emotionality. Psicothema, 19(3), 375-380.
Frenda, S. J., Nichols, R. M. & Loftus, E. F. (2011). Current issues and advances
in misinformation research. Current Directions in Psychological Science,
20(1), 20-23.
Gordillo, F., Arana, J., Mestas, L., Salvador, J., García, J., Carro, J., Pérez, E. (2010).
Emoción y memoria de reconocimiento: la discriminación de la información 61
negativa como un proceso adaptativo. Psicothema, 22(4), 765-771.
Justel, N., Psyrdellis, M. & Rueltti, E. (2013) Modulación de la memoria emocio-
nal: una revisión de los principales factores que afectan los recuerdos.
Suma psicológica, 20(2), 163-174.
Kensinger, E. A. & Corkin, S. (2003). Effect of negative emotional content on
working memory and longterm memory. Emotion, 3(4), 378-393.
Labar, K. S. (2007). Beyond fear: emotional memory mechanisms in the human
brain. Current Directions in Psychological Science, 16(4), 173-177.
Lockenhoff, C. E. & Cartensen, L. L. (2004). Socioemotional selectivity theory, aging
and health: the increasingly delicate balance between regulating emotions
and making tough choices. Journal of personality, 72(6), 1395-1424.
Mikels, J. A., Larkin, G. R., Reuter-Lorenz, P. A. & Carstensen, L. L. (2005). Divergent
trajectories in the aging mind: Changes in working memory for affective ver-
sus visual information with age. Psychology and Aging, 20(4), 542-553.
Ochsner, K.N. (2000). Are affective events richly recollected or simply familiar?
The experience and process of recognizing feelings past. Journal of Experi-
mental Psychology: General, 129(2), 242-261.
Porter, S., Spencer, L. & Birt, A. R. (2003). Blinded by emotion? Effect of the
emotionality of a scene on susceptibility to false memories. Canadian
Journal of Behavioural Science, 35(3), 165-175.
Quevedo, J., Sant, M. K., Madruga, M., Lovato, I., de-Paris, F., Kapeznski, F.,
Izquierdo, I. & Cahill, L. (2003). Differential effects of emotional arousal in
short- and long- term memory in healthy adults. Neurobiology of Learning
Memory, 79(2), 132-135.
Ruetti, E., Mustaca, A. & Bentosela, M. (2008). Memoria emocional: efectos de
la corticoesterona sobre los recuerdos. Revista Latinoamericana de Psico-
logía. 40(3), 461-474.
Van Damme, I., Smets, K. (2014). The power of emotion versus the power of su-
ggestion: memory for emotional events in the misinformation paradigm.
Emotion, 14(2), 310-320.
Yegiyan, N. & Yonelinas, A. P. (2011). Encoding details: positive emotion leads to
memory broadening. Cognition and emotion, 25(7), 1255-1262.

62
MEDIR Y EVALUAR
ANEXO 1
Media de las imágenes escogidas de la
p ru e b a p i loto .

NO. VALENCIA DE LA IMAGEN MEDIA


1 Negativa 1.24
2 Negativa 1.36
3 Negativa 1.39
4 Negativa 1.52
5 Negativa 1.59
6 Negativa 1.68
7 Negativa 1.71
8 Negativa 1.81
9 Negativa 1.82
10 Negativa 1.84
11 Neutra 2.91
12 Neutra 2.92
13 Neutra 2.98
14 Neutra 2.98
15 Neutra 3.02
16 Neutra 3.04
17 Neutra 3.04
18 Neutra 3.15
19 Neutra 3.18
63
20 Neutra 3.36
21 Positiva 4.34
22 Positiva 4.37
23 Positiva 4.40
24 Positiva 4.40
25 Positiva 4.44
26 Positiva 4.46
27 Positiva 4.46
28 Positiva 4.49
29 Positiva 4.50
30 Positiva 4.52
64
MEDIR Y EVALUAR

Discusiones actuales sobre el uso de


instrumentos de medición psicológica
en procesos de evaluación

La ética y los números


E N S A Y O S

65
DISCUSIONES ACTUALES SOBRE
EL USO DE INSTRUMENTOS DE
MEDICIÓN PSICOLÓGICA EN
P RO C E S O S D E E VA L UAC I Ó N

E n la actualidad, la evaluación psicológica y el desarrollo de instrumentos de


66 medición han experimentado una diversificación, no solo en cuanto a la población
objetivo (paso de evaluaciones individuales a evaluaciones masivas de estudiantes en
los diferentes niveles educativos, así como de personal que aspira a ingresar a cargos
MEDIR Y EVALUAR

de carrera administrativa en el sector público y privado), sino también en cuanto a los


atributos que se pretenden medir (paso de énfasis cognitivo, centrado en los cono-
cimientos y competencias en áreas fundamentales de la educación básica y media,
al análisis de competencias funcionales y comportamentales que se espera desplie-
guen los docentes y directivos docentes en su quehacer pedagógico, por citar solo un
ejemplo), y a la finalidad de dichas evaluaciones (diagnóstico, selección, clasificación,
ascenso, reubicación, nombramiento en propiedad) (Anitei & Buzea, 2012).
Colombia no ha sido ajena a esta dinámica, de manera que se pueden apreciar
tres tendencias importantes en lo que a procesos de evaluación masiva se refiere,
procesos que, en sus diferentes fases, hacen uso de instrumentos psicológicos:
1. La reglamentación e implementación del Sistema Nacional de Evaluación de la
Calidad de la Educación, en donde, a través del ICFES, se aplican anualmente evalua-
ciones censales a los estudiantes de 3, 5 y 9 grado (pruebas SABER 3, 5 y 9), grado 11
(SABER 11) y estudiantes de últimos semestres de educación superior (SABER PRO),
donde se pretende analizar y hacer seguimiento al desarrollo de las competencias
Ana Cristina Santana Espitia / [email protected]
Estudiante del Doctorado en Psicología
Universidad Nacional de Colombia, sede Bogotá

básicas de los estudiantes en sus diferentes niveles educativos, en concordancia


con los estándares básicos de competencias de las áreas que son evaluadas por las 67
pruebas (Grupo de Investigación sobre Pruebas Masivas, 2008; Hoyos, 2010).
2. La promulgación de la Ley 909 de 2004, la cual consagra la estructura, organización y
funciones de la Comisión Nacional del Servicio Civil (CNSC), entidad que, de acuerdo con
el Artículo 130 de la Constitución Política de Colombia, es responsable de la administra-
ción y vigilancia de las carreras de los servidores públicos. Está orientada a

Posicionar el mérito y la igualdad en el ingreso y de-


sarrollo del empleo público; velar por la correcta apli-
cación de los instrumentos normativos y técnicos que
posibiliten el adecuado funcionamiento del sistema de
carrera; y generar información oportuna y actualizada,
para una gestión eficiente del sistema de carrera admi-
nistrativa. (Comisión Nacional del Servicio Civil, 2014)

La Ley 909 contempla también lo concerniente a empleo público, gerencia públi-


ca y normas de carrera administrativa
3. Específicamente, en el sistema de carrera para los docentes que se
encuentran vinculados al sector público, mediante el Decreto 1278 de
2002, se ha incorporado la cultura de la evaluación en diferentes mo-
mentos del servicio docente: evaluación de ingreso, donde el aspirante
a docente es evaluado en aptitud numérica, aptitud matemática, saber
pedagógico, dominio sobre los conocimientos profesionales discipli-
nares básicos y prueba psicotécnica (actitudes, intereses y motivacio-
nes que se ponen en juego cuando se abordan situaciones propias de
procesos pedagógicos o de gestión institucional) (Instituto Colombia-
no para la Evaluación de la Educación, 2013); evaluación de período de
prueba y de desempeño, en donde se evalúan competencias funcio-
nales y comportamentales relacionadas con el cargo, y evaluación de
competencias, dirigida a los docentes y directivos docentes que deseen
ascender o reubicarse dentro del escalafón.
Las discusiones contemporáneas sobre el uso de los instrumentos
psicológicos, específicamente, en evaluaciones masivas en educación,
aunque bien podrían ser aplicables en otras esferas de la sociedad
donde la evaluación tiene lugar, se han centrado, principalmente, en la
adecuación y pertinencia de las pruebas para evaluar a individuos con
diferencias en cuanto a estrato socioeconómico, cultura, etnia, región
de origen, ya que se aduce que las pruebas favorecen a los individuos
de grupos específicos (ej. personas de estratos altos), mientras que las
personas no pertenecientes a dichos grupos obtienen resultados infe-
riores a los esperados. Al respecto, Bustamante (2003) plantea, en su
artículo, una serie de hipótesis sobre el uso de las evaluaciones ma-
68 sivas en Colombia, desde la perspectiva del sociólogo francés Pierre
Bourdieu. Para efectos de este ensayo, se analizarán cuatro de ellas
(las hipótesis 5, 6, 8 y 13), a fin de determinar sus pros y contras en el
MEDIR Y EVALUAR

marco de la evaluación masiva nacional y, específicamente, en cuanto


al uso de instrumentos de medición psicológica.
La quinta hipótesis de Bustamante (2003), señala que “Si estas
evaluaciones masivas entienden que la apropiación simbólica es igual
para todos, que todos se benefician igualmente de ella, posiblemente
poco ayuden a esclarecer los efectos estructurales de la desigualdad li-
gados al uso del lenguaje” (p. 36;énfasis agregado). En este orden de
ideas, el autor menciona que no es posible garantizar el supuesto de
homogeneidad en las condiciones de aplicación de las pruebas o la
tenencia del atributo objeto de evaluación de la misma manera para
todos los individuos, dado que el lenguaje que se usa en la construc-
ción de las pruebas reproduce las desigualdades que se observan en
la estructura social, y “como la apropiación simbólica se da a través
de la estructura social, y como ésta no es igualitaria, por lo tanto, no
todos tienen acceso a lo simbólico de la misma manera, ¡así se les
haya dicho lo mismo!” (p. 36), de manera que, en términos del autor,
“la evaluación, más allá de medir algo, hace aparecer como diferencia
de competencia individual (antes se decía “inteligencia”) lo que ha sido
causado socialmente” (p. 36).
Si bien es cierto que los usuarios de las evaluaciones masivas
son individuos con diferencias culturales y geográficas importantes,
no quiere decir que posean esquemas conceptuales diferentes por su
pertenencia a dichos grupos, es decir, la manera como los individuos
se apropian y organizan la información de las diferentes áreas del
conocimiento o en la definición de los atributos y características que
configuran su personalidad tienen aspectos comunes, con indepen-
dencia de su pertenencia a uno u otro grupo social, comunalidades
que hacen posible la comunicación entre los individuos y la difusión
del conocimiento.
En ese sentido, es preciso reconocer, no obstante, las comuna-
lidades en los esquemas conceptuales, que existen acercamientos
diferenciales a los objetos de la cultura por parte de los individuos, y
estas diferencias no obedecen a criterios psicométricos o de cons-
trucción de los instrumentos, de modo que Bustamante (2003) sitúa
como un problema de las evaluaciones aquello que es un problema de
la manera como las personas acceden al conocimiento, bien sea a los
instrumentos de producción de las competencias y a los lugares de
expresión legítima (contextos de aplicación).
Teniendo en cuenta lo anterior, lo que el sistema educativo debe
garantizar es que todos los individuos tengan la misma disponibilidad y
acceso a los objetos de la cultura en general, no solo los que son sus- 69
ceptibles de ser evaluados en estrategias de lápiz y papel. El contenido
de los instrumentos de medición debe responder, precisamente, a esos
objetos culturales y educativos que son aprehendidos por la totalidad de
los estudiantes colombianos en el aula e, incluso, en las interacciones
que se dan en el aula y fuera de ella (p. ej. piénsese el caso de las com-
petencias ciudadanas). Al respecto Álvarez (2001), indica que:

Entendida la educación como acceso a la cultura y a la


ciencia –bienes comunes históricamente construidos–, el
reto que cada profesor tiene es no dejar a nadie fuera. To-
mar conciencia de este hecho es comprometerse con mo-
dos razonables de actuar con cada sujeto que se encuentre
en esa situación delicada para no excluir a nadie de la par-
ticipación del saber. (p. 13)
La sexta hipótesis de Bustamante (2003) menciona que “si estas
evaluaciones masivas coadyuvan a construir la idea de una lengua ‘co-
mún’, su acción puede haber ido en detrimento de expresiones lingüísti-
cas y comunicativas que son significativas desde el punto de vista social”
(p. 37; énfasis agregado). En este apartado, el autor menciona que
la escuela y las evaluaciones masivas privilegian una lengua oficial
particular, una manera lingüística concreta en la cual están estruc-
turados tanto los contenidos educativos como la arquitectura formal
de las evaluaciones aplicadas en el aula y fuera de ella, generando
con ello, en términos del autor, un desconocimiento y rechazo de las
expresiones lingüísticas como dialectos y regionalismos provenientes
del saber cultural de grupos considerados como minoritarios.
Con relación a esta hipótesis, puede mencionarse que el autor
presenta una confusión entre los criterios internos del uso de un co-
nocimiento público, como lo son los criterios internos de una lengua,
con las variaciones culturales válidas, reconocidas para comunidades
minoritarias. Toda área del conocimiento tiene una estructura pública,
que debe ser conocida por los usuarios de la misma, y la evaluación
no puede ser ajena a las características formales y de contenido de
dichas áreas, de manera que los instrumentos de medición son tam-
bién objetos culturales públicos que no pueden violar los criterios pú-
blicos a los cuales deben obedecer; eso no significa que se ignoren las
variaciones culturales pertinentes.
La octava hipótesis de Bustamante (2003) indica que “si estas
evaluaciones masivas fetichizan y relativizan el lenguaje, posiblemente
70 contribuyan poco a entender el valor de uso de la lengua” (p. 37; énfasis
agregado). En esta hipótesis, el autor menciona que, aunque en las
evaluaciones educativas bien sea dirigidas a estudiantes o docentes
MEDIR Y EVALUAR

se definan las competencias como un “saber hacer en contexto”, en-


tendiendo el contexto como el brindado por los textos que se emplean
para elaborar las preguntas, los instrumentos de evaluación son el
contexto donde solo se evalúan las áreas de conocimiento en las si-
tuaciones creadas por la prueba.
En cuanto a esta observación de Bustamante (2003), es importan-
te señalar que la elaboración de instrumentos de medición psicológica
de cualquier atributo sigue por un proceso riguroso de construcción
en donde participan docentes expertos en las áreas de conocimiento
(docentes, para el caso de las evaluaciones masivas de corte cogniti-
vo), o expertos en las competencias funcionales y comportamentales
(docentes y directivos docentes con vasta experiencia en el sector
educativo, para el caso de las pruebas docentes en sus diferentes
etapas), de modo que el contenido de los ítems que conforman las
pruebas no es artificial y arbitrario, sino producto de consensos entre
profesionales expertos, donde hay acuerdos no solo en la naturaleza
de las temáticas a evaluar, sino que las pruebas se sustentan en pro-
cesos de validación de constructo y de contenido que garantizan la
calidad de las inferencias que pueden realizarse a partir de los resul-
tados obtenidos por las pruebas.
En ese sentido, Gómez e Hidalgo (2005) citan la posición de Mes-
sick respecto a la validez señalando que

[…] la validez no es del test o de la observación, lo que se


valida son las inferencias derivadas de las puntuaciones
del test o de otros indicadores, inferencias sobre el signi-
ficado de las puntuaciones o la interpretación para propó-
sitos aplicados y sobre las implicaciones para la acción, es
decir, las consecuencias sociales y éticas. (p. 5)

La hipótesis 13 de Bustamante (2003), menciona que “por su pro-


pio funcionamiento, estas evaluaciones masivas pueden haber contribui-
do a unificar criterios curriculares, pedagógicos y lingüísticos” (p. 40;
énfasis agregado). El autor menciona que a partir de los resultados de
las evaluaciones masivas, pueden extraerse cuatro tipos de validez:

1. Validez de los usos lingüísticos, en términos de las respues-


tas correctas e incorrectas en pruebas nacionales de tipo
censal o muestral.
2. Validez de las prácticas pedagógicas, en cuanto al fomento y 71
promoción de aquellas que contribuyen a lograr buenos des-
empeños en las pruebas.
3. Validez de las costumbres educativas, ya que la cultura de la
evaluación orienta la planeación y ejecución de los elemen-
tos curriculares (planes de área, de asignatura) en todas las
áreas y grados.
4. Validez de las políticas educativas, pues tienen valor aquellas que
apuntalen y sean direccionadas por las evaluaciones masivas.

Con relación a esta hipótesis, no puede desconocerse que las infe-


rencias resultantes de los procesos evaluativos han sido determinan-
tes en la toma de decisiones en distintos niveles del sistema educativo
y, en ese sentido, los instrumentos de medición (pruebas) son solo un
insumo, no la única herramienta que se toma en cuenta para el di-
seño de políticas educativas a nivel local y nacional. Por ello, es tan
importante garantizar la validez de los instrumentos de medida, por-
que lo que entra en juego es “la adecuación, significado y utilidad de
las inferencias específicas hechas con las puntuaciones de los tests”
(APA, AERA, NCME, 1985, p. 8). En la determinación de la validez de un
instrumento de medición,

Una variedad de evidencias pueden obtenerse de las puntua-


ciones producidas por un test dado, y hay muchas formas de
acumular evidencia para apoyar una inferencia específica. (…)
Aunque la evidencia puede ser acumulada de muchas formas,
la validez se refiere siempre al grado en que esa evidencia
apoya las inferencias que se hacen a partir de las puntuacio-
nes. (APA, AERA, NCME, 1985, p. 8).

Específicamente, la hipótesis de Bustamante (2003) señala 4 ti-


pos de evidencia, los cuales pueden extraerse a partir de los resulta-
dos de las evaluaciones masivas a nivel educativo, las cuales deben
ser analizadas cuidadosamente, para determinar su relevancia y per-
tinencia dentro del sistema educativo. En cuanto a la validez de los
usos lingüísticos, ya se comentó, en un apartado anterior, que no se
ignoran las variaciones culturales y lingüísticas de los grupos deno-
minados minoritarios, sino que lo que pretende evaluar la prueba, en
tanto objeto cultural público y accesible para todos los usuarios (es-
tudiantes, en este caso), es un conjunto público de conocimientos y/o
dimensiones cognitivas que configuran las áreas del saber, las cuales
deben ser asequibles para todos los estudiantes. Por ello, no se eva-
lúa como correcto o incorrecto el saber cultural de los estudiantes,
72 sino se valora su desempeño en un producto público, que recoge una
cierta evidencia de los aprendizajes en el aula, complementando las
evidencias provenientes del proceso de evaluación formativa que se
MEDIR Y EVALUAR

da en el aula de clase (Álvarez, 2001).


La validez de las prácticas pedagógicas, a diferencia de lo planteado
por Bustamante (2003), no se garantiza exclusivamente por los resulta-
dos de las pruebas externas. Las prácticas pedagógicas tienen su mayor
evidencia de validez en la medida en que los estudiantes aprehendan los
conocimientos y competencias propias del área; además, que estén en la
capacidad de utilizar ese conocimiento en situaciones de la vida cotidia-
na, aspecto que puede comprobarse principalmente en los procesos de
evaluación interna e, incluso, en las interacciones escolares y aquellas
que trasciendan el espacio físico de la institución.
Los resultados de las pruebas educativas no deben usarse para
hacer procesos de entrenamiento mecánico en las instituciones edu-
cativas ni deben ser empleadas como mecanismo sancionatorio de X
o Y abordaje pedagógico, el quid del asunto es lograr que los docentes
se acerquen a los resultados de las pruebas externas no con temor y
recelo, sino que se haga un uso pedagógico de los resultados de dichas
evaluaciones, en la medida en que permitan retroalimentar no solo las
competencias y componentes en los que los estudiantes presentan al-
tos y bajos desempeños, sino proporcionen pistas acerca de las posi-
ble continuidad o adecuación de aspectos pedagógicos, metodológicos
y didácticos de la clase que podrían redundar en el desarrollo acadé-
mico y convivencial de los estudiantes.
Los docentes no deben enseñar e impartir conocimientos en función
de los resultados de las pruebas externas y/o de las posibles consecuen-
cias asociadas a ellas (evaluación de altas consecuencias) (Tierney, 2014),
sino enseñar para formar mejores individuos en todos los aspectos, sien-
do la escuela el escenario privilegiado, donde tienen lugar los procesos de
socialización que iniciaron desde el seno familiar. Álvarez (2001) define, de
manera precisa, lo que debe ser la evaluación en educación: “En el ámbito
educativo debe entenderse la evaluación como actividad crítica de apren-
dizaje, porque se asume que la evaluación es aprendizaje en el sentido
que por ella adquirimos conocimiento” (p. 12).
En cuanto a la validez de las costumbres educativas, es preciso
indicar que la cultura de la evaluación no viene dada única y exclusiva-
mente por los procesos de evaluaciones masivas. Cualquier proyecto
educativo institucional y, en consonancia, cualquier modelo pedagógi-
co que adopta una institución educativa, tiene de fondo una concepción
de evaluación, de lo que se considera debe ser el objeto de la misma,
inclusive, de las estrategias más eficaces para acceder a las eviden-
cias que permitan dar cuenta del grado de aprehensión de dichos ob-
jetos evaluativos. La evaluación también, transversaliza, por así de- 73
cirlo, los procesos mismos de gestión institucional, tal es el caso de
los Planes de Asignatura y Área, Planes de Mejoramiento Institucional,
Planes de Apoyo al Mejoramiento, Planes Operativos Anuales.
El análisis de los desempeños docentes, a su vez, es visto desde
la lupa de la evaluación de desempeño para los docentes regidos por
el Decreto 1278 de 2002, en el que se analizan las competencias com-
portamentales y funcionales de cada cargo, frente a las evidencias
que aporta el docente (rúbricas, portafolios, proyectos pedagógicos,
observaciones de clase). Para este caso, aun cuando las competencias
funcionales y comportamentales vienen dadas a partir de las direc-
trices del Ministerio de Educación Nacional y la Comisión Nacional del
Servicio Civil, hay consensos, desde principio de año, entre los docen-
tes y los evaluadores sobre las actividades a desarrollar y los produc-
tos que serán tenidos en cuenta como objetos de evaluación.
Finalmente, con relación a la validez de las políticas educativas,
cabe anotar que las inferencias provenientes de los resultados de
las evaluaciones masivas en educación aplicadas tanto a estudian-
tes como a docentes han tenido una considerable incidencia no solo
en cuanto a la adopción de políticas públicas (ej. Promulgación de la
Ley 1620 de 2013 de convivencia escolar, inclusión del componente
de competencias ciudadanas en las pruebas SABER), sino en la es-
tructuración de programas e iniciativas educativas diseñadas con el
propósito de fortalecer las competencias de los estudiantes (Progra-
ma Todos a Aprender, Programa de Bilingüismo, promoción de meca-
nismos de convivencia ciudadana y defensa de los derechos humanos,
sexuales y reproductivos). A nivel docente, los resultados de las eva-
luaciones masivas constituyen insumos para el desarrollo de Progra-
mas de Formación Docente, en aras de una cualificación permanente
en su quehacer pedagógico.
Una vez revisadas estas hipótesis, se aprecia la necesidad de conti-
nuar indagando sobre la naturaleza de las implicaciones sociales, éticas
y económicas en la aplicación de instrumentos psicológicos en procesos
de evaluación a gran escala. Si bien se han dado discusiones importantes
en el sector educativo, en donde la tendencia general apunta al reconoci-
miento de la importancia de los procesos evaluativos tanto de procesos
como de los miembros del sistema educativo, pese a las voces de opo-
sición de ciertos gremios docentes y sindicales (Hoyos, 2010), es impor-
tante analizar la incidencia del uso de las pruebas en escenarios como la
selección de personal administrativo y de carrera en otro tipo de orga-
nizaciones y esferas estatales (ej. rama judicial, organismos adscritos a
ministerios como el de Salud, de Protección Social).
El debate también puede darse en torno al uso de atributos psi-
74 cológicos como personalidad, intereses, actitudes (Rothstein & Goffin,
2006), e incluso trascender las técnicas de evaluación tradicionales,
como las pruebas de lápiz y papel, de modo que otras técnicas de
MEDIR Y EVALUAR

aproximación al conocimiento psicológico de los individuos, como las


entrevistas situacionales y la estructura que deben tener en esta clase
de procesos de selección, sean aspectos tenidos en cuenta por psicó-
logos y psicómetras (Whetzel & McDaniel. 2009).
Referencias
Álvarez, J. (2001). El campo semántico de la evaluación: Más allá de las definiciones.
En: J. Álvarez (Ed.). Evaluar para conocer, examinar para excluir (pp. 11-26). Ma-
drid: Ediciones Morata
American Psychological Association [APA], American Educational Research As-
sociation [AERA], and National Council on Measurement in Education [NCME].
(1985). Standards for educational and psychological testing. Washington, D.C.:
American Psychological Association
Anitei, M. & Buzea, E. (2012). Models and applications in psychological selection
and evaluation. Procedia - Social and Behavioral Sciences, 33, 756-760.
Bustamante, G. (2003). Competencias y evaluaciones masivas en Colombia: Una mi-
rada desde Bourdieu. Pedagogía y Saberes, (18), 33-44.
Comisión Nacional del Servicio Civil (2014). ¿Quiénes somos? Recuperado de
http://www.cnsc.gov.co/index.php/institucional/direccionamiento-estrate-
gico/quienes-somos-cnsc
Gómez, J. & Hidalgo, M. (2005). La validez en los tests, escalas y cuestionarios.
Revista La sociología en sus escenarios, 12, 1- 14. 75
Grupo de Investigación sobre Pruebas Masivas en Colombia. (2008). El surgimien-
to del Servicio Nacional de Pruebas del ICFES en las voces de sus protago-
nistas. Magistro, 2(3), 115-134.
Hoyos, L. (2010). Evaluaciones masivas y estandarizadas, mal necesario, para me-
dir la calidad de la educación en Colombia. Pedagogía Magna, 8, 108-119.
Instituto Colombiano para la Evaluación de la Educación [ICFES]. (2013). Guía de
orientación para las pruebas de aptitudes y competencias básicas y psicotécni-
ca de ingreso a la carrera docente para directivos docentes y docentes de pobla-
ción mayoritaria. Bogotá: ICFES
Rothstein, M. G. & Goffin, R. D. (2006). The use of personality measures in person-
nel selection: What does current research support? Human Resource Mana-
gement Review, 16(2), 155-180.
Tierney, R. D. (2014). Fairness as a multifaceted quality in classroom assessment.
Studies in Educational Evaluation. Recuperado de: http://dx.doi.org/10.1016/j.
stueduc.2013.12.003
Whetzel, D. L. & McDaniel, M. A. (2009). Situational judgment tests: An overview of
current research. Human Resource Management Review, 19(3), 188-202.
LA ÉTICA Y
LOS NÚMEROS

La ética es una de las áreas de estudio más difíciles de la psicología, debido a


76 que no existen respuestas claras. A esta afirmación, realizada por Banyard y Flana-
gan (2005), se añadiría que su nivel de dificultad aumenta, además, porque la ética
cambia a través del tiempo, a medida que la profesión se desarrolla hacia nuevas
MEDIR Y EVALUAR

áreas. Así, la ética en psicología ha avanzado significativamente en áreas como la


clínica, el desarrollo infantil y la investigación con sujetos no humanos; sin embargo,
este avance no se ha presentado en aspectos como el manejo de datos, a pesar de
que este último es un punto álgido en la construcción del conocimiento psicológico.
Los números se asumen, en nuestra cultura, como sinónimos de objetividad,
detrás de la cual se corre con la esperanza de encontrar la seguridad que da el
tener un poco de realidad, o de “verdad”. No obstante, al escudriñar la raíz de estos
números, se pueden encontrar sorpresas no muy agradables… ¿De dónde salieron?
¿De una medición realizada por humanos, con todos los sesgos que eso implica? El
hecho de que esa medición haya sido equiparada con un número no cambia el sesgo
que trae consigo. Esta fe ciega en los números, sin analizar cómo fueron obtenidos,
es lo que se podría llamar una falacia numérica, una falacia que se tiene que analizar
y, si es el caso, derrumbar. Ya que, aunque suene paradójico, el número tiene que ser
bajado de su pedestal y ser cuestionado para que se convierta en algo más objetivo,
no en el sentido de algo aséptico, sin error y sin sesgo, sino como algo que presenta
Jazmine Escobar Pérez / [email protected]
Estudiante del Doctorado en Psicología
Universidad Nacional de Colombia, sede Bogotá

esos sesgos (que no se pueden eliminar por completo) que están explícitos, de forma
que se puede saber hasta qué punto ese número está dando información confiable. 77
El sesgo y el error son omnipresentes en la investigación psicológica. Por ejemplo,
siempre habrá sesgo en el investigador, y lo importante es tenerlo presente y realizar
actividades de control para minimizarlo. Las faltas a la ética, en este aspecto, pueden
ubicarse en un continuo desde los errores no intencionales hasta el fraude propiamente
dicho. Grandes transgresiones a la ética, como fabricar datos o modificar los existentes,
ya caen en un tipo de conducta claramente ilegal. Pero, fuera de estas violaciones monu-
mentales, hay otras prácticas que también son faltas a la ética. La siguiente reflexión se
centrará más en este tipo de prácticas, quizá porque son más cotidianas, y representan
tentaciones en las que se puede caer más fácilmente.

Recolección d e l o s d at o s
Esta es una de las fases más importantes de la investigación, ya que de ella se
obtienen los datos que serán analizados y, finalmente, generarán conocimiento sobre el
área. Una vez planteados los objetivos de la investigación, las hipótesis y la metodo-
logía que se va a seguir, se seleccionan los instrumentos por medio de los cuales se
accederá a los datos. Esos instrumentos deberán estar validados para la población
a la que se aplicarán. Utilizar instrumentos validados en otros países (así se tra-
te de países de habla hispana) no garantiza que se esté midiendo el
mismo constructo que se quiere evaluar aquí. El número que resulta
de esa medición no se puede interpretar, menos aún si se trata de co-
munidades con características particulares. Por ejemplo, una prueba
de personalidad como el MMPI aplicada a la comunidad Wayuu puede
puntuar para alguna patología comportamientos característicos de
su cultura como el de “hablar con espíritus”. Otro caso que se puede
presentar mucho en nuestro país tiene que ver con las pruebas que
exigen un nivel determinado de comprensión lectora. Son muchas las
pruebas que exigen, por ejemplo, mínimo cuarto grados de educación
secundaria, pues presumen que así se tiene el nivel necesario para
entender las instrucciones y los ítems. No obstante, eso no se puede
garantizar, pues hay muchas personas que son “analfabetas funcio-
nales”, es decir, que no entienden lo que leen. Por ello, se requieren
entrevistas cognoscitivas, que indaguen si en realidad la población a la
que va dirigida la prueba la entiende, o si se debe elaborar una forma
alterna que requiera menores niveles de comprensión verbal.
Este apartado incluye, también, todas las formas de sesgo que
afectan la validez interna y de constructo de un estudio, pues es respon-
sabilidad del investigador conocerlas y controlarlas mediante diseños
adecuados. La ignorancia no disculpa el error en el que se incurra y las
consecuencias que este puede llegar a tener. Por ejemplo, con frecuen-
cia el diseño experimental requiere incluir diferentes tipos de personas
en muestras representativas para poder hacer inferencias ciertas. Si
se quiere hacer una investigación descriptiva sobre los efectos de una
78 droga psicotrópica sobre las relaciones interpersonales, por ejemplo,
las pruebas no se pueden aplicar únicamente a personas que no han te-
nido dificultades mayores en sus relaciones sociales o, por el contrario,
MEDIR Y EVALUAR

solamente a personas que han tenido esas dificultades. Eso generaría


claramente un sesgo hacia uno de los dos extremos. Por su parte, para
acceder a los datos por medio de la observación, se requieren definicio-
nes muy claras de lo que se va a observar e indicadores suficientes que
permitan registrar la conducta blanco. Además, se requieren mínimo
dos observadores, para realizar un acuerdo intersubjetivo que disminu-
ya el sesgo de un solo observador.

Selección t e n d e n c i o s a d e l o s d at o s
Este aspecto es muy delicado y tiene que ver con el momento en el
que ya se cuenta con la base de datos y se toman decisiones poco éti-
cas respecto a qué datos entrarán o no dentro del análisis. Hay varias
prácticas claramente antiéticas en esta instancia, por ejemplo: selec-
cionar los datos que se ajustan a la hipótesis y descartar los que no lo
hacen. Otra conducta antiética es el uso fraudulento de la estadística,
que permite ver más cosas de las que en realidad se tienen. En este
caso, se selecciona la mediana, la moda o la media como medida de
tendencia central según se ajuste más a lo que el investigador quiere
mostrar. En el libro “Cómo mentir con estadística” se hacen explicitas
este tipo de prácticas.
Una decisión a la que se enfrentan los investigadores al iniciar el
análisis es qué hacer con los datos atípicos o anómalos. El eliminarlos
para mejorar la estadística no es una opción correcta, debido no solo
a que es una forma de sesgar la información, sino a que estos datos
pueden contener información muy valiosa. En el caso, por ejemplo, de
un tipo de terapia que genere una sobre-sensibilización en pacientes
con características particulares de activación fisiológica, la informa-
ción sería clínicamente relevante. Si se presentan situaciones espe-
ciales en las que se hace necesario eliminar los datos atípicos, como
en el caso de que una persona responda hacia un extremo (en lo que
Kazdin [2001] ha denominado “sujeto negativo”), se debe sustentar la
eliminación del dato y dejarla explícita.

Discusión sesgada
Este apartado es de gran relevancia en los artículos científicos,
ya que allí se explicita el aporte al conocimiento que se ha generado,
y muchos lectores tomarán decisiones para su práctica profesional
a partir de él. En la discusión, se suelen hacer muchas inferencias,
pero es crucial que todas se hagan con el suficiente sustento empí-
rico. Por ello, debemos preguntarnos: ¿los datos realmente permiten
derivar esa inferencia?, ¿la interpretación se está sesgando para favo- 79
recer la hipótesis?, ¿se omitieron hallazgos que no están de acuerdo
con la hipótesis o que son difíciles de explicar por la teoría?, ¿se está
generalizando directamente de especies no humanas a la humana, sin
tomar en cuenta mecanismos de acción y sin el suficiente sustento
teórico y/o empírico?, ¿se está atribuyendo causalidad cuando se trata
de estudios correlacionales o, menos aún, descriptivos? El valor de un
artículo científico no se mide únicamente por la capacidad que tuvo el
investigador de corroborar las hipótesis de trabajo (alterna) sino por la
calidad del nuevo conocimiento que se produce o que, potencialmente,
se puede producir. Esto último hace referencia al valor heurístico, por
ejemplo, de esos hallazgos difíciles de explicar, o de datos atípicos que
pueden generar nuevas preguntas de investigación.

Conclusión
Siempre se debe tener presente que los datos se utilizan para to-
mar decisiones, muchas veces, con grandes consecuencias sobre la
vida y el bienestar de las personas a corto, mediano y largo plazo. Los
resultados de una investigación pueden indicar acertada o equivoca-
damente, por ejemplo, qué terapia es significativamente más efecti-
va para una problemática particular (a corto plazo), qué modelo de
aprendizaje explica y predice mejor la depresión (a mediano plazo) o
en qué programa de promoción o prevención se invertirán determi-
nados recursos públicos (a largo plazo). Es decir, los números y su
interpretación tienen gran impacto social, y este puede ser positivo o
negativo dependiendo de la ética con que se hayan manejado.
Finalmente, recuerde evitar siempre la Ley de Murphy para la
estadística: “Si torturas suficientemente los datos, ellos dirán lo que tú
quieres oír”.

80
MEDIR Y EVALUAR
Referencias
Banyard, P. & Flanagan, C. (2005). Ethical issues and guidelines in Psychology.
New York: Routledge
Huff, D. (1991). How to lie with statistics. New York: Penguin Books.
Kazdin, A. (2001). Métodos de investigación en psicología clínica. México:
Pearson.

81
82
MEDIR Y EVALUAR

G*power 3: software para el análisis


de la potencia estadística
D I D Á C T I C A

83
G * P O W E R 3 : S O F T WA R E
PA R A E L A N Á L I S I S D E L A
P OT E N C I A E S TA D Í S T I C A

La potencia (statistical power) de una prueba estadística es la


probabilidad de que la hipótesis nula (N0) sea rechazada cuando
esta es falsa, en otras palabras, es la probabilidad de obtener
resultados estadísticamente significativos
(Cohen, 1992).

A unque el concepto de potencia estadística es bastante conocido en la inves-


84 tigación experimental, son muy pocos los trabajos en los que se toma en cuenta, lo
que indica una desatención importante por parte de los investigadores. Algunos es-
tudios muestran el escaso interés de gran parte de autores por controlar la potencia,
MEDIR Y EVALUAR

así como la omisión de exigencias al respecto por parte de las revistas especializa-
das (Bono & Arnau, 1995; Valera, Sánchez, Marín & Velandrino, 1998). Asimismo, se
observa un sobreuso y mal uso de la técnica de comprobación de la hipótesis nula en
el grueso de la investigación psicológica (Krantz, 1999; Jones & Sommerlund, 2007).
Otro error común es buscar solamente saber si la relación entre las variables que se
estudian es "estadísticamente significativa", desconociendo la potencia que puedan
tener sus resultados (Barker-Baussel, R. & Li, 2002).
Algunos autores (Barker-Baussel, R. & Li, 2002) consideran que la inferencia esta-
dística cuenta con dos pilares: La significancia estadística y la potencia estadística, sien-
do este último el más débil, en cuanto a uso y dominio de esta noción se refiere. Según
Bono & Arnau (1995), ambos pilares hacen parte de dos corrientes teóricas diferentes en
estadística, donde se enseñan temáticas que tiene la potencia estadística con el nivel de
significancia (α), tamaño de la muestra (n), y tamaño del efecto (TE). Cuando los valores
de cualquiera de los cuatro son modificados, los otros tres cambian y cuando tres de las
cuatro variables son modificadas, la cuarta resulta determinada.
Víctor Alexander Rivera Mancilla / [email protected]
Psicólogo
Universidad Nacional de Colombia, sede Bogotá

Tamaño del E f e c t o (TE)


El tamaño del efecto es el grado de discrepancia entre la H₀ y la H₁, en otras 85
palabras, es el grado en el que la hipótesis nula es falsa. El tamaño del efecto es un
indicador del distanciamiento de la evidencia experimental frente a la H₀. Por ejem-
plo, en una prueba t de diferencia de medias, cuanto más se aleje el índice t de 0,
mayor será el tamaño del efecto y mayores serán las probabilidades de rechazar la
hipótesis nula (H₀= no hay diferencias, es decir, un índice igual a 0). Cuando el tamaño
del efecto es muy bajo, aumenta el riesgo de cometer error tipo II si se rechaza la
hipótesis nula, esto depende del nivel de significancia con el que se trabaje.
Cuando se realizan análisis de potencia es necesario especificar el TE, lo cual no es
sencillo, ya que, muchas veces, no se tiene conciencia de la magnitud de los fenómenos.
La dificultad para determinar el tamaño del efecto se debe, principalmente, al sobreuso
de las pruebas de significación, donde solo se presta atención a la significancia, la cual
nos dice si hay diferencias significativas o no; sin embargo, poco informa sobre la magni-
tud real del fenómeno bajo estudio (Cohen, 1992a). Para conocer la importancia de un TE
determinado, es necesario remitirse a investigaciones anteriores del tema que se esté
abordando y/o adoptar ciertos criterios, como, por ejemplo, los aportados por Cohen
(1992b). Este mismo autor advierte sobre los riesgos de excederse en las convencionali-
dades y propone un uso razonable de las mismas.
Nivel de significancia (α)
El nivel de significancia (α) se refiere a la probabilidad de recha-
zar la hipótesis nula siendo cierta. Generalmente se fija en un valor
convencional de .05, el cual podría ser mayor o menor dependiendo
del tipo de estudio que se realice (por ejemplo, en un estudio explora-
torio es recomendable fijar valores de α un poco mayores). Cuando el
valor de α es muy estricto (por ejemplo, α=0,001), se reduce el riesgo
de incurrir en error tipo I; no obstante, se aumenta la probabilidad de
incurrir en error tipo II, denotada como β, reduciendo la potencia (ya
que esta última es el complemento de β). Teniendo esto en mente, es
importante ponderar los riesgos de cometer ambos tipos de error, tra-
tando de mantener un balance.

Tamaño muestral (N)


El tamaño muestral (N) también afecta la potencia. Valores gran-
des de N en las investigaciones aumentan la potencia, puesto que se
reduce el error aleatorio y hay una mayor probabilidad de que el fenó-
meno bajo estudio se presente (Arnau & Bono, 1995). Las conclusiones
que se deduzcan del estudio de una muestra, dependen de qué tan
representativa sea, así como de qué tanto se acerque al tamaño de la
población.

G*P o w e r 3
Dada la relación que hay entre estos conceptos y la importancia de
cada uno de ellos en el campo de la investigación social, es importante
86 contar con herramientas que permitan realizar estudios que incluyan
análisis de las cuatro importantes variables descritas anteriormente.
Este tipo de análisis son conocidos como estudios de potencia.
MEDIR Y EVALUAR

G*Power es un software de uso libre, creado por investigadores


de la Universidad Heinrich Heine de Düsseldorf en Alemania, el cual
permite realizar varios estudios de potencia para los test estadísticos
más usados (Universitat Dusseldorf, 2016):

• A priori
• Compromiso
• Criterio
• Post-hoc
• Sensibilidad

Faul, Erdfelder, Lang y Buchner (2007) mencionan que cualquiera


de estos análisis en G*Power 3 debe hacerse siguiendo cuatro pasos:
1) Seleccionar el test estadístico, 2) escoger uno de los cinco tipos de
análisis de potencia, 3) proporcionar los valores de entrada requeri-
dos para el análisis, y 4) seleccionar el botón “calculate” y obtener los
resultados.
A continuación, se ofrecerá un ejemplo de cómo realizar un aná-
lisis paso a paso de un estudio a priori. En este tipo de estudios se
calcula el tamaño muestral en función de un nivel α preestablecido, un
nivel 1 - β y el tamaño del efecto que se busca encontrar.

E j e m p lo de caso
En una investigación, se tiene como objetivo general encontrar di-
ferencias en la puntuación en una prueba de matemáticas entre estu-
diantes que hicieron parte de un método de enseñanza piloto (grupo A)
y otros que siguieron la instrucción tradicional (grupo B). Se trabajará
con un nivel α=0,05, una potencia esperada de 0,90 y un tamaño del
efecto grande (≥0,8). Los investigadores quieren conocer el tamaño de
muestra requerido para encontrar diferencias significativas que den
cuenta de que el método A es mucho más efectivo que el B. La prueba
estadística que se utilizará será la t diferencia de medias en muestras
independientes.
Para realizar este análisis, se debe iniciar el programa, el cual
muestra una ventana tal como se observa en la Figura 1.

87

Figura 1. Ventana principal del G*Power 3.


En primer lugar, se escoge el test estadístico que se utilizará. Para
este caso, se trata de una prueba t. Primero se selecciona la familia
del test (Figura 2) y, después, el test específico planeado para nuestro
trabajo (Figura 3).

Figura 2. Selección de la familia de test.

88
MEDIR Y EVALUAR

Figura 3. Selección del test. .


Después, en el siguiente menú desplegable, se escoge el estu-
dio de potencia que se desea realizar. En este caso, se trata de un
estudio a priori (Figura 4).

Figura 4. Selección del tipo de análisis de potencia – A priori.

En seguida, verificamos si los valores que aparecen por defec- 89


to en los parámetros de entrada corresponden con los que se tra-
bajarán en la investigación, de lo contrario se realizan los cambios
pertinentes (Figura 5). También se incluye la razón entre un grupo y
el otro, en este caso, dicha razón será de 1:1. Cabe recordar que los
valores que ingresemos en este paso, dependen de la naturaleza
de nuestro estudio y de las características que los investigadores
crean que deban tener sus resultados.
En este tipo de análisis a priori, se pueden modificar los pa-
rámetros, para ver cómo cambia el tamaño de muestra requerido
en función de ellos. Por ejemplo, si cambiamos el nivel α a un nivel
más restrictivo, seguramente aumentará el tamaño de muestra
requerido para evitar el error tipo I. Finalmente, se escoge la op-
ción “Calculate” que está en la parte inferior derecha de la ventana
(Figura 6).
Figura 5. Identificación del módulo de parámetros de entrada.

90
MEDIR Y EVALUAR

Figura 6. Definición de los parámetros de entrada y botón para calcular lo de salida.


Después de esto, obtenemos los parámetros de salida con su
respectiva gráfica, tal como se observa en la Figura 7. El tamaño de
muestra que se requiere, dados los niveles de error aceptados y el
tamaño de efecto esperado, es de 28 estudiantes para cada grupo.

Figura 7. Output del análisis a priori según los parámetros especificados.

91
Además de esta información, podemos obtener distintas gráficos
para modelar la relación entre los distintos parámetros de entrada
con el de salida (Figuras 8, 9 y 10).

Figura 8. Relación entre n y potencia.


Figura 9. Relación entre n y α.

92 Figura 10. Relación entre n y TE.


MEDIR Y EVALUAR

En este ejemplo se aprecia la utilidad del programa y la facilidad


para hacer uso de él. G*Power 3 ofrece distintos tipos de análisis para
una gran variedad de test estadísticos, lo cual pone al alcance de la
mano una herramienta bastante útil para los investigadores de dife-
rentes disciplinas.
Referencias
Barker-Baussel, R. & Li, Y. F. (2002). Power Analysis for Experimental Research.
A practical guide for the biological, medical and social sciences. Nueva
York: Cambridge University Press.
Bono, R. & Arnau, J. (1995). Consideraciones generales en torno a los estudios
de potencia. Anales de psicología, 11(2), 193-202.
Cohen, J. (1992). Statistical Power Analysis. Current Directions in Psychological
Science, 1(3), 98-101.
Cohen, J. (1992a). Cosas que he aprendido (hasta ahora). Anales de Psicología,
8(1-2), 3-18.
Cohen, J. (1992b). A power primer. Psychological Bulletin, 112 (1), 155-159.
Faul, F., Erdfelder, E., Lang, A.-G. & Buchner, A. (2007). G*Power 3: A flexible
statistical power analysis program for the social, behavioral, and biome-
dical sciences. Behavior Research Methods, 39(2), 175-191. DOI: 10.3758/
BF03193146
Jones, A. & Sommerlund, B. (2007). A critical discussion of null hypothesis
significance testing and statistical power analysis within psychological 93
research. Nordic Psychology, 59(3), 223-230.
Kraemer, H. C. (1985). A strategy to teach the concept and application of power
of statistical tests. Journal of Educational Statistics, 10(3), 173-195.
Krantz, D. (1999). The null hypothesis testing controversy in psychology. Jour-
nal of the American Statistical Association, 94(448), 1372-1381.
Universitat Dusseldorf. (2016). G*Power 3.1 Manual. Recuperado de: http://www.
gpower.hhu.de/fileadmin/redaktion/Fakultaeten/Mathematisch-Naturwis-
senschaftliche_Fakultaet/Psychologie/AAP/gpower/GPowerManual.pdf
Valera, A., Sánchez, J., Marín, F. & Velandrino, A. P. (1998). Potencia estadística
de la revista de Psicología General y Aplicada. Revista de Psicología Gene-
ral y Aplicada (1990-1992), 51(2), 233-246.
94
MEDIR Y EVALUAR

Programa de análisis cualitativo o QDA


(Qualitative Data Analysis) en inglés
S O F T W A R E

95
PROGRAMA DE ANÁLISIS
C U A L I TAT I V O O Q D A
( Q UA L I TAT I V E D ATA
A N A LY S I S ) E N I N G L É S

L os programas usados como herramientas en investigaciones en ciencias hu-


96 manas no son solo de corte cuantitativo; su uso, al igual que sus parientes, supone
una gran ayuda en el análisis y en la organización de la información recogida durante
la investigación. A continuación, les presentaremos diferentes opciones, desde las
MEDIR Y EVALUAR

más reconocidas hasta las más novedosas, las cuales les ayudará a escoger el pro-
grama que más se ajuste a los intereses de su investigación.

Más usados en C o lo m b i a
ATLAS . t i
Atlas.ti es un software desarrollado por ATLAS.ti Scientific Software Development
GmbH, usado principalmente para investigación y análisis de datos cualitativos. Esta
herramienta ayuda a los investigadores a descubrir y analizar sistemáticamente fe-
nómenos complejos ocultos en datos no estructurados (texto, multimedia, geoespa-
cial).
El programa provee herramientas que permiten, al usuario, localizar, codificar y
añadir anotaciones a datos obtenidos de primera mano, para sopesar y evaluar su im-
portancia; además de visualizar las usualmente complejas relaciones entre ellos. Es uno
de los programas cualitativos más usados a nivel mundial (Lewins & Silver, 2007).
Para conseguirlo se puede consultar: https://atlasti.cleverbridge.com/74/purl-order
Santiago Posada Jaramillo / [email protected]
Estudiante de psicología
Universidad Nacional de Colombia, sede Bogotá

Ethnograph
Ethnograph es un software desarrollado por Qualis Research Associates, usa- 97
do para hacer el análisis de los datos recolectados en investigaciones cualitativas
(Software-shop, 2016). Permite crear proyectos etnográficos, crear diferentes tipos
de memorandos, escribir memorandos en cualquier momento y lugar, añadir au-
tomáticamente palabras clave mientras se codifican los archivos, copiar mensajes
de texto al procesador de palabras, etc. Fue uno de los primeros programas para
análisis cualitativo del mundo (Informer Technologies Inc., 2016).
Para conseguirlo se puede consultar: http://www.qualisresearch.com/

NV i v o
Nvivo es un software desarrollado por QSR International. Fue diseñado para in-
vestigaciones cualitativas que trabajen con texto y/o multimedia, donde se necesiten
profundos niveles de análisis de los datos (QSR Intenational Pty Ltd., 2016). Permite
clasificar, sortear y organizar la información; examinar relaciones en los datos; y
combinar el análisis con referencias, con búsquedas y con modelos de datos. Con
este programa se pueden poner a prueba teorías, identificar patrones y hacer exa-
minaciones cruzadas en la información (Dearne, 2008).
Para conseguirlo se puede consultar: http://www.qsrinternational.com/pro-
duct
N o ta n u s a d o s e n C o lo m b i a , p e r o s í e n e l r e s to d e l m u n d o
H y p e r RESEARCH
HyperRESEARCH es un software desarrollado por ResearchWare,
y utilizado para investigación y análisis de datos cualitativos. Permite
la codificación y la recuperación del material de origen, la construc-
ción de teorías y el análisis de los datos. El programa trabaja con datos
gráficos, de texto, de audio y de video; mientras que permite compartir
los datos y las fuentes con otros usuarios. Es reconocido por ser fácil
de emplear; por su uso de diferentes tipos de metodologías para el
análisis; por el hecho de funcionar tanto en Windows como en Mac y
por sus capacidades multimedia (“HyperRESEARCH: What it is”, 2016).
Para conseguirlo se puede consultar:
http://www.researchware.com/products/hyperresearch.html

MAXQ DA
MAXQDA es un software desarrollado por VERBI GmbH para ana-
lizar datos tanto de texto como multimedia y tanto para investigación
cualitativa como mixta. A diferencia de la mayoría de programas de
este tipo, el MAXQDA no fue diseñado con la separación entre cuali-
tativo y cuantitativo en mente, por lo que su uso se puede extender
a investigaciones cualitativas, cuantitativas y mixtas, siendo esta una
de sus características más representativas (ReStore, 2016; Lewins &
Silver, 2007).
Pueden usarse hasta cuatro diferentes pantallas para la visua-
98 lización y organización de los datos, con la ayuda de memorandos
y codificación. Existe una versión básica (MAXQDA), una extendida
(MAXQDAplus, que permite la creación de diccionarios y la selección
MEDIR Y EVALUAR

de archivos de texto), una de lectura (MAXQDA Reader, que permite


leer archivos de MAXQDA sin licencia) y una para dispositivos móviles
(MAXApp, es un poco más limitada que la versión básica y es gratis)
(MAXQDA, 2016).
Para conseguirlo se puede consultar: http://www.maxqda.com/
products
Referencias
Lewins, A., y Silver, C. (2007). Using Software in qualitative research: a step-by-
step guide. Los Angeles: Sage.
Software-shop. (2016). Información General de Ethnograph. En: Software-shop.
com. Recuperado de: http://www.software-shop.com/in.php?mod=ver_
producto&prdID=52
Informer Technologies, Inc. (2016). E6 Ethnograph. Recuperado de: http://ethno-
graph.software.informer.com/
QSR Intenational Pty Ltd. (2016). What is Qualitative Research? Recuperado de
http://www.qsrinternational.com/blog/what-is-qualitative-research
Dearne, K. (2008). Not easy being green, but audits help. En: The Australian.
Business Review. Recuperado de: http://www.theaustralian.com.au/bu-
siness/technology/not-easy-being-green-but-audits-help/story-e6fr-
ganx-1111116779996
ResearchWare, Inc. (2016). HyperRESEARCH: What it is. En: ResearchWare, Inc. 99
Recuperado de: http://www.researchware.com/
ReStore. (2016). MAXqda Resources. En: ReStore. A sustainable web resources
repository. Recuperado de: http://www.restore.ac.uk/lboro/research/
software/maxqda.php
MAXQDA. (2016). Software for qualitative and mixed methods analysis. En:
MAXQDA. The art of data analysis. Recuperado de http://www.maxqda.
com/products
10 0
MEDIR Y EVALUAR

La revista Medir y Evaluar se terminó de imprimir en las


instalaciones de GRACOM Gráficas Comerciales ubicada
en la Ciudad de Bogotá, Colombia en la carrera 69K nº 70-
76 en el mes de Noviembre de 2016.
El tiraje es de 300 ejemplares en papel bulky.
Las familias tipográficas usadas fueron:
DIN Next LT Pro
Lato
Universidad Nacional de Colombia Revista Medir y Evaluar

También podría gustarte