José O. Medel Bello Antonio Martínez Pineda
Lucía Monroy Cazorla
Exámenes de ingreso en perspectiva
Marcos de referencia 1
José O. Medel Bello
Antonio Martínez Pineda
Lucía Monroy Cazorla
Exámenes de ingreso en perspectiva
Marcos de referencia 1
D.R. © 2009, Centro Nacional de Evaluación
para la Educación Superior, A.C. (Ceneval)
Av. Camino al Desierto de los Leones 19,
Col. San Ángel, Deleg. Álvaro Obregón,
C.P. 01000, México, D.F.
www.ceneval.edu.mx
Diseño y formación: Alvaro Edel Reynoso Castañeda
Julio de 2009
Impreso en México • Printed in México
Directorio
Dirección General
Rafael Vidal Uribe
Dirección General Adjunta de los EXANI
José O. Medel Bello
Dirección General Adjunta de los EGEL
Jorge Hernández Uralde
Dirección General Adjunta de Programas Especiales
Rocío Llarena de Thierry
Dirección General Adjunta Técnica y de Investigación
Lucía Monroy Cazorla
Dirección General Adjunta de Operación
Francisco Javier Apreza García Méndez
Dirección General Adjunta de Difusión
Javier Díaz de la Serna Braojos
Dirección General Adjunta de Administración
Francisco Javier Anaya Torres
Dirección de Procesos Ópticos y Caliicación
María del Socorro Martínez de Luna
Dirección de Tecnologías de la Información
y las Comunicaciones
Francisco Manuel Otero Flores
Índice
Introducción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Capítulo 1
Pruebas estandarizadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Desarrollo de pruebas estandarizadas
9
Pruebas normativas y criteriales
11
Pruebas referidas a la norma
11
Pruebas referidas a criterio
11
Capítulo 2
Pruebas de ingreso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
act
13
Diseño del act
13
Estructura del act
14
Reporte de resultados del act
17
Validez del act
18
bmat
19
Estructura del bmat
20
Reporte de resultados del bmat
20
Validez del bmat
21
dat
21
Diseño del dat
22
Estructura del dat
22
Reporte de resultados del dat
23
Confiabilidad y validez del dat
24
gamsat
25
Diseño del gamsat
25
Estructura del gamsat
26
Reporte de resultados del gamsat
27
gmat
27
Estructura del gmat
28
Reporte de resultados del gmat
30
Validez del gmat
31
gre
31
Estructura del gre
31
Reporte de resultados del gre
33
Validez del gre
34
lsat
34
Estructura del lsat
35
Reporte de resultados del lsat
36
Validez del lsat
36
mcat
Estructura del mcat
Reporte de resultados del mcat
pcat
pet
sat
Estructura del pcat
Reporte de resultados del pcat
Estructura del pet
Reporte de resultados del pet
Diseño del sat
Estructura del sat
Reporte de resultados del sat
Validez del sat
37
37
38
39
39
41
42
42
43
44
45
46
47
48
Capítulo 3
Pruebas internacionales de desempeño . . . . . . . . . . . . . . . . . . . . . 49
pisa
49
Diseño de pisa
50
Estructura de pisa
51
Reporte de resultados de pisa
52
timss
52
Diseño del timss
53
Estructura del timss
53
Reporte de resultados del timss
54
Capítulo 4
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Antecedentes del exani-i
57
Evolución del exani-i
58
Diseño del exani-i
61
Nueva estructura del exani-i
64
Reporte de resultados del exani-i
68
Numeralia 1994-2008
73
Validez del exani-i
74
exani-i
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
L
Introducción
os exámenes de ingreso son extremadamente importantes y su razón de
ser es muy sencilla. El historial académico y las caliicaciones son indicadores directos del desempeño de un estudiante. Si se dispone de ellos, ¿cuál
es la necesidad de utilizar un examen para decidir su ingreso a un programa
de educación superior? La pregunta debe tomar en cuenta que en México
la educación media superior es de lo más variado en cuanto a modalidades,
programas y contenidos curriculares, de ahí que para las instituciones de educación superior la comparación de los conocimientos y habilidades mostrados
por los sustentantes resulte muy compleja. Por consiguiente, la respuesta es
que un examen que evalúe las cualidades con que debe contar un estudiante
para cursar o tener éxito en el nivel superior resulta práctico y conveniente.
A este tipo de pruebas pertenecen los Exámenes Nacionales de Ingreso
(exani) desarrollados por el Centro Nacional de Evaluación para la Educación Superior (Ceneval). Los exani son pruebas de diagnóstico para los
estudios de nivel medio y superior. Proveen información sobre el grado de
desarrollo de habilidades intelectuales básicas y habilidades y conocimientos
especíicos necesarios para cursar exitosamente la educación media (exani-i),
superior (exani-ii) y posgrado (exani-iii). En este trabajo, cuando se habla
de exani, generalmente se reiere especíicamente al exani-i.
Aquí se ofrece una muy breve explicación sobre lo que es una prueba estandarizada y cuáles son sus características, antes de proceder a la revisión de
algunos exámenes de gran difusión que se han utilizado en diferentes países
como parte de procesos de ingreso a instituciones educativas de nivel superior
con base en su objetivo, tipo de reactivos, caliicación, contenidos y reporte de
resultados. Se revisan las características de dos de las pruebas internacionales
de desempeño más importantes. Por último, se exponen los rasgos principales
del exani-i.
7
B
Capítulo 1
Pruebas estandarizadas
ásicamente, una prueba estandarizada es aquella que sigue procedimientos
bien establecidos y consistentes en cada aplicación. No importa en qué
lugar o cuántas veces sea aplicada, los procedimientos mediante los cuales se
administra esa prueba siempre serán consistentes (Mertler, 2007).
Con la estandarización se brinda la misma oportunidad a todos los sustentantes, de modo que puedan compararse sus resultados sin importar que el
examen sea presentado en diferentes aplicaciones.
Los exámenes estandarizados se caracterizan por tener instrucciones claras
y bien deinidas, un tiempo límite para responder y una forma de caliicación
consistente. Se conforman tradicionalmente de reactivos de opción múltiple,
lo que facilita el proceso de caliicación que, al ser automatizado, elimina el
sesgo del juicio de un evaluador. No obstante, ante el reto de evaluar habilidades y competencias que difícilmente pueden evaluarse mediante reactivos
de opción múltiple, esto está cambiando y cada vez con mayor frecuencia los
exámenes incluyen preguntas que requieren la construcción de una respuesta,
lo que complica la estandarización de la caliicación; por ende, deben especiicarse criterios de caliicación que permitan disminuir lo más posible la subjetividad y que la caliicación continúe siendo consistente.
Desarrollo de pruebas estandarizadas
El proceso mediante el cual se construyen los exámenes estandarizados es
costoso en términos de tiempo y de inversión. Comienza con el establecimiento de objetivos para la evaluación y con la producción de reactivos, generalmente en un número muy superior al que se necesitará para la prueba
inalmente, que en seguida serán revisados por expertos en la materia en cuestión y por especialistas en construcción de pruebas, quienes constatarán que
su contenido sea pertinente con respecto a los objetivos y que la redacción
sea correcta y esté libre de ambigüedades y de indicios con los que sea dable
inferir la respuesta correcta.
9
10
Después, es necesario probar los reactivos en una muestra representativa
de la población a la que está dirigida el examen; los que presentan un mejor
comportamiento en cuanto a validez y coniabilidad se integran en la versión
inal de la prueba (Mertler, 2007). La validez se deine, de acuerdo con Kaplan y Saccuzzo (2006), como “la concordancia entre la puntuación o medida
de una prueba y la cualidad que se cree está midiendo”; es decir, la validez
atañe al asunto de si la prueba mide lo que debe medir. Y la coniabilidad se
reiere al grado en el cual las caliicaciones obtenidas en la prueba son consistentes (Mertler, 2007) a través del tiempo.
La validez y la coniabilidad son dos características primordiales de cualquier examen estandarizado; también es indispensable comprobar las propiedades estadísticas en los reactivos para determinar que la dispersión de
las caliicaciones sea funcional: el índice de diicultad y la discriminación del
reactivo:
• El índice de diicultad es igual a la proporción de estudiantes que contestan
de forma correcta un reactivo (Mertler, 2007). Su valor puede ir de 0 a 1;
mientras menor sea su valor, el reactivo presenta una mayor diicultad. Si se
expresa como porcentaje este índice es conocido como grado de diicultad.
• El índice de discriminación del reactivo es una medida de la diferencia en
la respuesta al reactivo de los estudiantes con mejores puntajes y los que
tienen los puntajes más bajos. Su valor luctúa entre -1 y 1; mientras más
alto sea su valor, mayor será su discriminación (National Postsecondary
Education Cooperative, 2000).
Con base en estas características se obtiene una versión operativa de la prueba. Es necesario aplicar esta versión a una muestra representativa de la población para normar el examen. Los resultados de esta aplicación sirven como
parámetro para hacer comparaciones de las caliicaciones individuales con las
de esa población.
Exámenes de ingreso en perspectiva
Pruebas normativas y criteriales
Pruebas referidas a la norma
Según el tipo de caliicación que utilice, una prueba puede clasiicarse como
normativa o criterial.
Las pruebas normativas permiten comparar las caliicaciones de cada estudiante con el desempeño esperado de la población, estimado a partir de una
muestra representativa de la población o “grupo normativo”. De lo que se
trata al inal es de poder comparar el desempeño de cada sustentante con el
de sus compañeros.
La caliicación de un examen con referencia a la norma puede expresarse
en diferentes escalas:
• Rangos percentiles
• Escalas de desarrollo o de crecimiento
• Caliicaciones lineales estándar
• Caliicaciones estándar normalizadas
Los rangos percentiles son una de las escalas más frecuentes en los reportes
de caliicación de exámenes normativos, pese a que su comprensión se diiculta
y suele confundirse con el porcentaje de aciertos (Mertler, 2007). El uso de
escalas de desarrollo o de crecimiento tiene como limitante el hecho de que se
trata de escalas únicas que no pueden compararse con los resultados de otras
versiones, a diferencia de las caliicaciones estandarizadas que surgen de la conversión de los puntajes crudos a una escala común, con características bien
deinidas y conocidas. Tal es el caso, por ejemplo, de las caliicaciones lineales
estándar que nos muestran la distancia del puntaje crudo de cada estudiante con
respecto de la media y la desviación estándar del grupo normativo (Nitko, 2001).
Pruebas referidas a criterio
En las pruebas referidas a la norma el resultado del estudiante es comparado
o caliicado con respecto a los resultados de otros pares que han presentado el
11
12
mismo examen; pero en las pruebas referidas a criterio la caliicación de cada
estudiante no depende del desempeño de otros. En este tipo de pruebas se
preestablece en un parámetro lo que un estudiante debe saber y las habilidades
que debe haber adquirido, y su caliicación refrenda si tiene conocimientos y
habilidades y qué tanto los ha desarrollado. La interpretación de las pruebas
referidas a criterio no se basa en análisis estadísticos, sino en el establecimiento de puntos de corte (Mertler, 2007).
En general, las pruebas referidas a criterio se reportan de acuerdo a si se
cumple con el criterio. El reporte más conocido, por ejemplo, es el de “aprobado” y “reprobado”, aunque existen otras “etiquetas” que, dependiendo del
examen, designan el nivel que alcanzó el sustentante. Alguna información
complementaria que muchas veces se ofrece como resultado puede ser el número o porcentaje de aciertos, así como los aciertos en cada una de las áreas
evaluadas.
Exámenes de ingreso en perspectiva
Capítulo 2
Pruebas de ingreso
E
act
l American Collage Test (act) es un examen de admisión de aspirantes a
la educación superior en los Estados Unidos; mide las habilidades académicas que son necesarias para el buen desempeño en los programas universitarios; reúne, procesa y reporta datos acerca de los estudiantes de nivel
preparatoria para que éstos puedan planear adecuadamente su educación y
que las instituciones que ofrecen dicha instrucción sean capaces de detectar
con precisión las necesidades de sus estudiantes; la consejería académica, la
acreditación y evaluación de estudios, la asignación de diversos tipos de asistencia inanciera para los estudiantes, la identiicación de estudiantes talentosos y el otorgamiento de becas escolares son algunas otras de las decisiones
que se toman con base en los resultados del act. Desde su publicación en
1988 la prueba se hizo acreedora a un reconocimiento emitido por un comité
integrado por la Asociación Americana de Investigación Educativa (aera) y
la Asociación Psicológica Americana (apa) entre otras instancias, denominado
Código de Prácticas Justas de Evaluación en la Educación.
Diseño del act
Un supuesto fundamental del diseño del act es que la forma de evaluar la
preparación de un estudiante que pretende ingresar a la universidad es la medición directa de las habilidades que se requieren para realizar adecuadamente
el trabajo académico en dicho nivel educativo. Por eso el act es una prueba
de logro educativo que busca determinar el grado de habilidad que un estudiante ha desarrollado para resolver problemas, captar signiicados implícitos,
hacer inferencias, ponderar ideas y formular juicios en diversas materias que
son importantes para la educación universitaria (act, 2007).
Las preguntas que lo conforman exigen de los estudiantes la capacidad de
integrar los diversos conocimientos y habilidades adquiridos durante su formación preparatoria. Las respuestas que los estudiantes dan a cada uno de los
13
reactivos se procesan para generar los puntajes obtenidos, de ahí que se asuma
que dichos puntajes están directamente relacionados con el progreso educativo de los estudiantes en cada una de las áreas curriculares. Por consiguiente,
se puede considerar que este programa de medición forma parte importante
de la transición entre la educación preparatoria y la universitaria.
El proceso mediante el cual se hizo la especiicación de conocimientos y
habilidades que se miden en el act constó de varios pasos: análisis de estructuras curriculares, revisión de libros de texto, consultas a profesores y construcción de consensos en paneles de expertos.
14
Estructura del act
El act se compone de cuatro instrumentos (tabla 2.1) de opción múltiple –inglés,
matemáticas, lectura y ciencia– y de un examen de escritura (opcional) (act, 2007).
El examen de inglés del act mide dos tópicos: la comprensión de las convenciones del inglés escrito (puntuación, gramática y usos y estructuras del
enunciado) y la destreza retórica de los sustentantes (estrategia, organización
y estilo). El examen consta de cinco textos elegidos por sus propiedades para
evaluar las destrezas de escritura y para identiicar los intereses y experiencias
de los sustentantes. Cada texto es acompañado por reactivos de opción múltiple que se reieren a fragmentos del texto, los cuales pueden incluir errores, y
ofrecen diferentes alternativas para sustituir dichos fragmentos incluyendo la
opción de “sin cambio”. También se incluyen preguntas referentes al texto
en general; y el estudiante tiene que elegir aquí la opción más apropiada.
El examen de matemáticas está diseñado para evaluar las habilidades de
Razonamiento matemático de los sustentantes; contiene reactivos que demandan la solución práctica de problemas de matemáticas; se requiere de los conocimientos de fórmulas y cálculo mínimos para iniciar un curso de 12° grado
exitosamente, incluyendo los contenidos que se enuncian en la tabla siguiente,
al igual que los contenidos de los otros exámenes del act:
Exámenes de ingreso en perspectiva
Tabla 2.1. Estructura del
Áreas
Inglés
Matemáticas
act
Contenido
Usos/mecánicos
Habilidades retóricas
Total
Preálgebra/álgebra elemental
Álgebra intermedia/geometría
coordinada
Geometría plana/trigonometría
Total
Lectura
Estudios sociales/ciencias
Artes/literatura
Total
Ciencia
Comprensión
Análisis
Generalización
Escritura
Ensayo
Número
de reactivos
40
35
75
24
18
18
60
Tiempo
45 minutos
60 minutos
20
20
40
35 minutos
40
35 minutos
30 minutos
El examen de lectura del act mide la comprensión de lectura con base
en las habilidades para relacionar y razonar. Los reactivos requieren que los
estudiantes reieran contenidos explícitos de los textos incluidos en el examen
y también que mediante el razonamiento extraigan sus signiicados implícitos,
a partir de la localización e interpretación de detalles signiicativos, la determinación de ideas principales, comparaciones, comprensión de relaciones de
causa y efecto, comprensión de secuencias de sucesos, esclarecimiento del signiicado de palabras, frases y enunciados del contenido en relación con el contexto, generalizaciones y análisis de la voz o del método del autor o narrador.
Se incluyen cuatro textos de características similares a los textos que se encontrarán en el primer año de college: un texto para ciencias sociales, uno para
ciencias naturales, uno de prosa de icción y uno de humanidades. Cada texto
15
es seguido de reactivos de opción múltiple que se centran en conjuntos de habilidades que se complementan y que son necesarios para estudiar materiales
escritos de diversas materias.
El examen de ciencias naturales del act mide la interpretación, evaluación,
razonamiento, análisis y solución de problemas necesarios en las áreas que
abarca: biología, física, química y ciencias de la tierra/espacio.
Se presentan siete conjuntos de información cientíica en tres diferentes
formatos:
• Representaciones de datos (gráicas, tablas y otras formas de esquemas)
• Resúmenes de investigación (descripción de muchos experimentos
relacionados)
• Puntos de vista divergentes (presentación de muchas hipótesis relacionadas pero inconsistentes entre sí).
16
El examen de escritura (opcional) solicita a los sustentantes desarrollar un
argumento con base en dos opiniones encontradas respecto de un tema dado,
y defender alguna de estas opiniones o desarrollar una diferente.
El act abarca cuatro niveles cognitivos: conocimientos y habilidades, aplicación directa, comprensión de conceptos y comprensión conceptual integrada, que se describen a continuación:
• Conocimientos y habilidades. Usar uno o más hechos, deiniciones, fórmulas o
procedimientos para resolver problemas que son presentados en términos
puramente matemáticos.
• Aplicación directa. Requiere aplicar uno o más conceptos, deiniciones, fórmulas o procedimientos para solucionar un problema planteado en una
situación de la vida real.
• Comprensión de conceptos. Requiere llevar a cabo un proceso de razonamiento
en el cual, a partir de un concepto, se obtiene una inferencia o conclusión.
En otras palabras, evalúa la profundidad de entendimiento que poseen los
estudiantes de conceptos principales para hacer una inferencia o llegar a
una conclusión.
Exámenes de ingreso en perspectiva
• Comprensión conceptual integrada. Prueba la capacidad de integrar la comprensión de dos o más conceptos a in de resolver problemas no rutinarios.
La prueba del act (2007) se construye tomando en cuenta dos tipos de
especiicaciones: las de contenido y las estadísticas.
El objetivo de las especiicaciones de contenido es mantener la estructura
básica de la prueba para que las escalas de caliicación sean comparables año
con año. Las características especíicas de los reactivos se revisan y reforman
regularmente y diieren ligeramente año con año.
Las especiicaciones estadísticas de la prueba indican el índice de diicultad
y la discriminación (correlación punto biserial) mínima de los reactivos.
La prueba está construida con una media de diicultad objetivo de 0.58, con
un rango de diicultad para los reactivos de 0.20 a 0.89. Con respecto a la discriminación, los reactivos deben tener una correlación punto biserial de 0.20
o más con las caliicaciones de la prueba que miden contenidos comparables.
Reporte de resultados del act
Para las cuatro áreas obligatorias se transforman los puntajes crudos en puntajes estandarizados en una escala de 1 a 36. Se otorga una caliicación compuesta que es el promedio de las cuatro caliicaciones de las áreas redondeado
al entero más próximo.
Se reportan también siete subcaliicaciones que son independientes de las
caliicaciones de cada área; dos corresponden a inglés, dos más a lectura y tres
a matemáticas. Estas subcaliicaciones se reportan en una escala con rango
entre 1 y 18 puntos (act, 2007).
A los aspirantes que presentan el área de escritura se les otorgan dos caliicaciones en un rango de 1 a 6 puntos. La subcaliicación del área de escritura
es la suma de estas dos caliicaciones y tiene un rango de 2 a 12 puntos. Se
asigna también una caliicación combinada de las áreas de inglés y escritura en
la escala 1-36 que no afecta la caliicación compuesta de la prueba.
17
En el reporte de caliicaciones se incluye una gráica con los rangos percentiles para cada una de las secciones (igura 2.1).
Figura 2.1. Muestra del reporte de calificaciones
para quienes presentan el act
18
Validez del act
Con respecto a la validez del act (2005), se considera que el desempeño durante el primer año de la universidad determina el éxito o el fracaso posterior:
los estudiantes que suelen tener diicultades en ocasiones desertan, pero si
superan ese primer año, su desempeño suele mejorar o mantenerse. Por consiguiente, un indicador importante del probable éxito universitario es el logro
durante el primer año.
Los resultados de un estudiante en ese periodo pueden estar asociados a
varios factores, entre ellos las habilidades desarrolladas durante su formación
preparatoria, los cursos tomados, las caliicaciones obtenidas, los intereses y
objetivos personales, y algunas características no académicas –como curiosidad intelectual, habilidad para trabajar en equipo, etcétera (Andrews & Ziomek, 1998).
Exámenes de ingreso en perspectiva
El act, por medio de los instrumentos incluidos, proporciona información
acerca de las habilidades que se consideran necesarias para el éxito académico
en la universidad; además, mediante sus secciones cgis (sección de información sobre cursos y caliicaciones), el peril del estudiante y el inventario de
intereses, provee información acerca de los cursos y caliicaciones de la educación preparatoria, los intereses y objetivos personales.
En términos de la relación que hay entre los puntajes de las pruebas del
act y los del primer año de la universidad, se ha observado en diversos estudios que los promedios compuestos del act permiten a las instituciones
diferenciar el probable éxito de los estudiantes en función de su nivel de logro
medido por las pruebas. Estos puntajes se usan en combinación con los promedios de la educación preparatoria; sin embargo, se ha visto que el uso de
los promedios de la educación preparatoria no tiene gran capacidad predictiva
por sí solo (Andrews & Ziomek, 1998).
Los resultados del ACT están fuertemente relacionados con las caliicaciones de los cursos del nivel educativo anterior (high school) y el Grade Point
Average (gpa), que, combinados, explican entre el 30 y el 55% de la varianza
en los puntajes del act (Nobel, Davenport, Schiel & Pommerich, 1999).
bmat
El Bio-Medical Admission Test es una prueba que se utiliza como parte del proceso de selección para el ingreso a cursos de medicina o veterinaria y especíicamente para la materia de biomedicina en la Universidad de Cambridge desde
2003, y en otras prestigiadas universidades del Reino Unido. Es una prueba de
ejecución máxima con el objetivo de discriminar efectivamente a los aspirantes con las capacidades necesarias para los cursos universitarios.
19
Estructura del bmat
La prueba se compone de tres secciones: Conocimientos cientíicos y sus aplicaciones, Habilidades y aptitudes y Tarea de escritura, con las siguientes características (tabla 2.2).
Tabla 2.2. Estructura del
Sección
Conocimientos
científicos y sus
aplicaciones
20
Habilidades
y aptitudes
Tarea de
escritura
bmat
Contenido
Número
de reactivos
Solución de problemas
Entendimiento de un argumento
Análisis de datos e inferencia
Total
13
10
12
35
Biología
Química
Física
Matemáticas
Total
Ensayo
6-8
6-8
6-8
5-7
27
Tiempo
Aproximadamente 8 min.
Aproximadamente 8 min.
Aproximadamente 8 min.
Aproximadamente 6 min.
30 minutos
Aproximadamente 30 min.
Aproximadamente 15 min.
Aproximadamente 15 min.
60 minutos
30 minutos
La sección de Conocimientos cientíicos y sus aplicaciones evalúa si el sustentante tiene los conocimientos esenciales para cursar estudios superiores de
ciencias biomédicas, y si es capaz de aplicar dichos conocimientos.
La sección de Habilidades y aptitudes evalúa habilidades genéricas utilizadas comúnmente en los estudios universitarios.
Por último, la Tarea de escritura brinda una oportunidad para determinar
si el sustentante es capaz de considerar los diferentes aspectos de una proposición y expresarlos de forma escrita.
Reporte de resultados del bmat
El reporte de resultados se extiende a cada institución de interés para el aspirante. Cada sección tiene un cuadernillo aparte. En las primeras dos secciones
Exámenes de ingreso en perspectiva
(Conocimientos cientíicos y Habilidades) cada pregunta tiene valor de 1 para
el puntaje crudo, que se transforma a la escala bmat de 9 puntos con espacio
para un decimal. El ensayo de la tercera sección recibe una caliicación en una
escala de 0 a 15 que releja la calidad general del ensayo. La caliicación del
ensayo se realiza mediante un proceso de doble caliicación por jueces; en caso
de una gran diferencia entre estas dos caliicaciones se realiza una tercera bajo
la supervisión de personal del equipo de evaluación de Cambridge.
Validez del bmat
Las relaciones entre los resultados del bmat 2005 y los resultados de las evaluaciones después del primer año de carrera, realizadas en el verano de 2007,
demostraron una fuerte predicción del desempeño durante el primer año después del ingreso a las carreras de medicina (r=0.27) y veterinaria (r=0.42) en la
Universidad de Cambridge, mayor para la sección de Conocimientos cientíicos y sus aplicaciones (r=0.44) que para la sección de Habilidades y aptitudes
(r=0.24) (Emery, 2007).
dat
El Dental Admission Test (dat) es una prueba desarrollada a partir de 1945. Su
aplicación es mediante la computadora (generalmente en línea) y está compuesta de una batería de cuatro instrumentos de opción múltiple que mide
la capacidad académica general, comprensión de la información cientíica y
capacidad de percepción. Es parte del proceso de ingreso para escuelas de
odontología en Estados Unidos y Canadá; aun cuando cada país diseña su
prueba, son aceptadas como equivalentes para el ingreso a las escuelas de ambos países. Cada escuela determina la relevancia de la prueba para la admisión.
21
22
Diseño del dat
El dat se construye mediante la determinación de especiicaciones obtenidas
a través de un análisis de prácticas profesionales, cuyo propósito es contar con
información de los conocimientos y habilidades necesarios en la práctica de
la profesión.
En el dat se utilizan reactivos de opción múltiple pues son los más ventajosos y versátiles en las pruebas objetivas.
El proceso de construcción de las pruebas que integran el dat es continuo
y diferente en cada una de ellas. Para las pruebas de razonamiento cuantitativo y el cuestionario de ciencias naturales se efectúa anualmente –a lo largo y
ancho de Estados Unidos– una captación de reactivos hechos por académicos
en sus respectivas materias de enseñanza. Estos reactivos son revisados en su
contenido y características psicométricas por los comités de construcción de
pruebas del dat con base en los estándares establecidos.
Para la prueba de Comprensión de lectura se solicita a las escuelas y facultades
de odontología redacten textos y reactivos para incluirlos en la prueba. Mientras
tanto, consultores, especialistas y personal de la Asociación Dental Americana
(ada) desarrollan los reactivos para la prueba de Habilidad perceptual.
Estructura del dat
Los instrumentos que componen la prueba son Razonamiento cuantitativo,
Habilidad perceptual, Comprensión de lectura y un cuestionario de Ciencias
naturales (tabla 2.3).
Exámenes de ingreso en perspectiva
Tabla 2.3. Estructura del
Sección
Razonamiento
cuantitativo
Habilidad
perceptual
Comprensión
de lectura
Ciencias
naturales
dat
Contenido
Problemas matemáticos
Problemas matemáticos aplicados
Total
Aperturas
Ángulo de discriminación
Conteo de cubos
Desarrollo de forma 3D
Papel plegado
Reconocimiento visual
Pasajes de lectura (3)
Biología
Química general
Química orgánica
Total
Número
de reactivos
Tiempo
30
10
40
45 minutos
90
60 minutos
50
60 minutos
40
30
30
100
90 minutos
Los reactivos de la prueba se clasiican en tres niveles cognitivos: comprensión, análisis y razonamiento.
Son dos los parámetros en que se basa la inclusión de reactivos en la estructura del dat: su grado de diicultad y la correlación punto biserial. El grado
de diicultad recomendado para los reactivos del dat se establece entre 40 y
70%, aunque la media del grado de diicultad para los reactivos tiende hacia el
límite superior de este rango; y para su correlación punto biserial no se indica
un criterio mínimo en el Manual del usuario (ada, 2005), pero se considera que
un reactivo con “un coeiciente de correlación alto de 0.45 puede indicar que un
reactivo contribuye en gran medida a la consistencia, precisión y coniabilidad
de la capacidad que se está midiendo.” (Ibíd.).
Reporte de resultados del DAT
La caliicación de este examen se da a conocer al aspirante y a la escuela o
escuelas en las que hizo su solicitud; al primero se le entrega un reporte no
23
oicial al terminar el examen y sólo se entregan reportes oiciales a las segundas. Cada prueba usada en la batería del dat arroja un puntaje bruto que se
estandariza para poder hacer comparaciones entre diferentes aplicaciones de
la prueba. Se presenta una caliicación estandarizada en un rango de 1 a 30
puntos para cada una de las áreas. No existe un puntaje aprobatorio, pero la
media a nivel nacional es de 17 puntos.
24
Confiabilidad y validez del dat
Para determinar la calidad del dat se evalúan la coniabilidad y la validez de
la prueba. De acuerdo con el Manual del usuario (ada, 2005), la consistencia
interna del dat –evaluada mediante la fórmula de Kuder-Richardson (kr20)–
tiene los siguientes coeicientes para las cuatro pruebas:
• Razonamiento cuantitativo 0.85 (con base en 40 reactivos)
• Comprensión de lectura 0.86 (50 reactivos)
• Encuesta de Ciencias naturales 0.92 (100 reactivos)
• Habilidad perceptual 0.92 (75 reactivos)
En cuanto a la validez de la prueba, cada año se analiza la relación entre los
puntajes del dat y las evaluaciones del primer año en la carrera (igura 2.2).
La siguiente tabla muestra, en general, una relación positiva entre los puntajes
del dat y el desempeño en el primer año en la escuela de odontología (Ibíd.)
Cuando se incluyen todos los puntajes del dat y el gpa, se explica el 30% de
la varianza del primer y segundo año de los grados en biomédicas, técnicas
dentales preclínicas y promedios de grado (ada, 2007). Cuando se consideran
exclusivamente los resultados del primer año, el coeiciente es signiicativamente mayor, como se comprueba en la siguiente tabla, seguramente porque
temporalmente se encuentran más cerca.
Exámenes de ingreso en perspectiva
Figura 2.2. Coeficientes de correlación media (R de Pearson)
para los grupos de primer año en el ciclo 2002-2003 de las escuelas
de odontología. Tomada del Manual del usuario (ada, 2005)
BioMedical
Science
Predental GPAs
Total
Science
DAT Scores
Quantitative Reasoning
Reading Comprehension
Biology
General Chemistry
Organic Chemistry
Survey of the Natural Sciences
Perceptual Average
Multiple R
DAT
DAT and GPAs
0.391
0.387
0.197
0.232
0.266
0.297
0.285
0.363
0.145
0.357
0.487
0.582
Preclinical
Operative
Technique
First
Year
GPA
0.257
0.243
0.397
0.393
0.401
0.491
0.483
0.606
0.140
0.126
0.122
0.152
0.140
0.172
0.283
0.194
0.201
0.269
0.261
0.294
0.282
0.349
0.194
0.376
gamsat
Diseño del gamsat
El gamsat (Graduate Australian Medical School Admission Test) es un examen desarrollado por el Australian Council of Educational Resaearch (acer) como parte
del proceso de selección de estudiantes que desean ingresar a alguna escuela de
medicina. Está diseñado para evaluar la capacidad de cursar estudios de nivel
intelectual elevado y se utiliza en Australia, el Reino Unido y en otros países.
Evalúa las capacidades, habilidades y destrezas obtenidas y desarrolladas
previamente por aspirantes que hayan terminado el Bachelor o que al presentar
el examen se encuentren cursando el penúltimo o último año, sin importar que
esta formación no esté relacionada con un campo de estudio cientíico. El enfoque del examen se centra en la solución de problemas (acer, 2007).
25
Estructura del gamsat
El gamsat consta de tres secciones (tabla 2.4). La sección 1 evalúa habilidades de interpretación y comprensión de ideas en los contextos social y cultural. Se conforma con preguntas de opción múltiple en relación a textos, con
lo cual se evalúa:
• Comprensión.- Implica el reconocimiento de signiicados explícitos e implícitos mediante la atenta lectura de palabras, frases y de interpretaciones
generales del texto.
• Razonamiento plausible.- Involucra la interrelación y elaboración de conceptos e ideas, así como de conclusiones.
• Pensamiento crítico.- Requiere de la capacidad de hacer discriminaciones y
juicios en el ámbito del razonamiento plausible.
26
En la sección 2 se prueba la habilidad de producir y desarrollar ideas de
forma escrita. Consiste en dos tareas de las cuales se ofrecen varias ideas para
que el sustentante desarrolle una de ellas. Los temas tienden más a lo general
que a lo especíico; la primera de las tareas trata sobre un tema sociocultural y
la segunda sobre un tema más personal y social. Estas tareas se caliican con
dos criterios: la calidad de las ideas expresadas sobre el tema y el control del
lenguaje demostrado en el escrito.
En la sección 3 se examina la resolución de problemas en un contexto
cientíico y la evocación y comprensión de conceptos cientíicos básicos. Estas competencias incluyen la capacidad de identiicar los conocimientos en
nuevos contextos y de traducir los conocimientos de una forma simbólica a
otra. Para esto se presentan estímulos en una gran variedad de formatos, incluyendo el verbal, el matemático, el gráico y el visual. La sección se compone
de preguntas en las áreas de química, biología y física en un formato de opción
múltiple y el nivel de conocimiento exigido es el requerido en un curso de química, física y biología del primer año de estudios universitarios.
Exámenes de ingreso en perspectiva
Tabla 2.4. Estructura del
Sección
Sección 1 (S1)
Sección 2 (S2)
Sección 3 (S3)
gamsat
Contenido
Razonamiento en humanidades
y Ciencias sociales
Comunicación escrita
Razonamiento en Ciencias
biológicas y físicas
Número
de reactivos
Tiempo
75
100 minutos
110
170 minutos
2 ensayos
60 minutos
Reporte de resultados del gamsat
Se obtienen cuatro caliicaciones para el gamsat, una para cada sección y una
caliicación total para el examen que se obtiene del promedio ponderado de
las secciones mediante la siguiente fórmula:
S1 + S2 + 2S3
4
Todas las caliicaciones se reportan en una escala de 0 a 100 puntos. Se proporciona una tabla que permite a los sustentantes calcular su rango percentil
para ubicar su desempeño en relación con la población que participó en la
misma aplicación de la prueba.
gmat
El General Management Admission Test es utilizado como fuente de datos para
ayudar a determinar el ajuste de cada candidato a estudios de posgrado con
los programas de mba (Maestría en administración de negocios). Esta prueba
–que se desarrolla en los Estados Unidos pero que es utilizada en diferentes
países– se conforma de tres partes principales: la evaluación de escritura analítica, la sección cuantitativa y la sección verbal.
27
28
Estructura del gmat
La sección de evaluación de escritura analítica está diseñada para ser una medida directa de pensar críticamente y de comunicar ideas de forma escrita.
Consta de dos ensayos: uno para el análisis de un tema –que mide la capacidad
de explorar la complejidad del tema (o de una opinión) ijando una posición a
partir de los conocimientos propios– y otro sobre el análisis de un argumento
–que mide la capacidad de formular una crítica con base en una conclusión,
siguiendo una línea de pensamiento establecida (tabla 2.5).
La sección cuantitativa mide la capacidad de razonar cuantitativamente,
resolver problemas cuantitativos e interpretar gráicas. Consta de dos tipos
de preguntas de opción múltiple, resolución de problemas y suiciencia de datos, que requieren conocimientos de aritmética, álgebra elemental y conceptos
generales de geometría. Cada uno de los dos tipos de pregunta es descrito a
continuación:
• Las preguntas de solución de problemas están diseñadas para medir habilidades matemáticas básicas, comprensión de conceptos matemáticos elementales y razonamiento cuantitativo.
• Las preguntas de suiciencia de datos están diseñadas para medir las habilidades al analizar un problema cuantitativo, reconocer la información relevante y determinar cuánta información es necesaria para resolver un problema. Cada una de estas preguntas es precedida por dos enunciados, de
los cuales se debe elegir el que contiene los datos necesarios para responder
la pregunta. Se ofrecen cinco opciones de respuesta para estas preguntas:
• El enunciado (1) por sí mismo es suiciente, pero el enunciado (2) no
es suiciente.
• El enunciado (2) por sí mismo es suiciente, pero el enunciado (1) no
es suiciente.
• juntos los dos enunciados son suicientes, pero ninguno lo es por separado.
• Cada enunciado por sí mismo es suiciente.
• Los dos enunciados juntos no son suicientes.
Exámenes de ingreso en perspectiva
La sección verbal mide la capacidad de leer y comprender materiales escritos, razonar y evaluar argumentos y el uso adecuado del idioma inglés. Esta
sección cuenta con tres contenidos principales:
• Comprensión de lectura. Mide la capacidad de comprender, analizar y utilizar
información y conceptos presentados de forma escrita mediante la evaluación de habilidades, a saber: comprensión de palabras y enunciados en
pasajes de lectura; comprensión de las relaciones lógicas entre puntos relevantes de la lectura; hacer inferencias de hechos y enunciados incluidos en
la lectura; entender y seguir el desarrollo de conceptos cuantitativos.
• Razonamiento crítico. Desarrollado para evaluar las capacidades involucradas
en el desarrollo y evaluación de argumentos y la formulación y evaluación
de planes de acción.
• Corrección de enunciados. Esta sección mide dos amplios aspectos del dominio
del lenguaje: la expresión gramatical y estructuralmente correcta y la efectividad para expresar una idea o relación clara y concisamente.
Tabla 2.5. Estructura del
Sección
Escritura
analítica
Sección
cuantitativa
Sección verbal
gmat
Contenido
Análisis de un tema
Análisis de un argumento
Total
Suficiencia de datos
Solución de problemas
Comprensión de lectura
Razonamiento crítico
Corrección de enunciados
Número de
reactivos
Tiempo
Ensayo
Ensayo
30 minutos
30 minutos
60 minutos
37
75 minutos
41
75 minutos
29
Reporte de resultados del gmat
El reporte de caliicaciones incluye cuatro puntajes y sus rangos percentiles
correspondientes: escritura analítica, sección cuantitativa, sección verbal y total. La escritura analítica tiene un rango de caliicación de 0 a 6; las secciones
cuantitativa y verbal se caliican en un rango de 0 a 60, y la caliicación total en
un rango de 200 a 800 puntos (igura 2.3).
Figura 2.3. Reporte de resultados del
gmat
30
Hay una peculiaridad en la forma de caliicar las secciones cuantitativa y
verbal. Puesto que es un examen administrado mediante la computadora, se
puede “ajustar” la diicultad del examen de acuerdo a la capacidad de cada
sustentante, de tal modo que la computadora parte de que el sustentante tiene
un nivel inicial de 500 y –dependiendo de si contesta correcta o incorrectamente cada pregunta– muestra una pregunta con mayor o menor grado de
Exámenes de ingreso en perspectiva
diicultad, respectivamente. Por este motivo la caliicación del sustentante no
depende directamente de cuántas preguntas contestó correctamente, sino de
la diicultad de las preguntas que contestó. De este modo se espera que al
terminar cada una de las secciones la caliicación sea una medida precisa de la
habilidad del sustentante.
Validez del gmat
En un meta-análisis hecho por Talento-Miller y Rudner (2005) que incluye
estudios de validez de la prueba realizados por el Validity Study Service (vss) entre 1997 y 2004, se conirma que el gmat tiene una validez excepcionalmente
alta para casi todos los programas incluidos en los estudios, con una media de
validez predictiva de 0.46 para programas en Estados Unidos y de 0.48 para
los programas fuera de ese país.
gre
El General Record Examination es una prueba diseñada para medir habilidades
de razonamiento, pensamiento crítico y la capacidad de comunicarse efectivamente de forma escrita (ets, 2004), independientemente de si tales habilidades son adquiridas sin relación con algún campo especíico de estudio de los
aspirantes a posgrado. Adicionalmente a la prueba general, se ofrecen ocho
pruebas de temas especíicos, que pueden ser requeridos por las instituciones
para el ingreso de sustentantes a programas especíicos.
El gre es desarrollado y administrado por el Educational Testing Service (ets)
y ha desempeñado un papel importante en los procesos de admisión a posgrado durante cerca de seis décadas.
Estructura del gre
Consta de tres áreas: Razonamiento verbal, Razonamiento cuantitativo y Escritura analítica, divididas en cinco secciones. Además se incluye una sección
31
32
“variable” que no cuenta para la caliicación (Tabla 2.6). El tiempo para resolver el examen es de 3 ¾ horas. A continuación se describen las áreas temáticas
del gre:
• Razonamiento verbal. Evalúa las habilidades para analizar y evaluar materiales
escritos, así como de sintetizar información, analizar relaciones entre componentes y partes de los enunciados y reconocer relaciones entre palabras
y conceptos.
• Razonamiento cuantitativo. Prueba las capacidades matemáticas básicas y la
comprensión de conceptos matemáticos básicos, al igual que las habilidades de razonar cuantitativamente y solucionar problemas en ambientes
cuantitativos.
• Escritura analítica. Diseñada para probar las capacidades de pensamiento
crítico y escritura analítica, así como las habilidades necesarias para articular y sustentar ideas complejas, analizar un argumento y sostener una
discusión coherente.
Tabla 2.6. Estructura del
Sección
Razonamiento
verbal
Razonamiento
cuantitativo
Escritura
analítica
gre
Contenido
Analogías
Antónimos
Completar enunciados
Comprensión de lectura
Aritmética
Álgebra
Geometría
Análisis de datos
Comparación cuantitativa
Solución de problemas
Opinión sobre un tema
Análisis de un argumento
Total
Exámenes de ingreso en perspectiva
Número de
reactivos
Tiempo
76
60 minutos
60
60 minutos
1
1
2
45 minutos
30 minutos
75 minutos
Reporte de resultados del gre
Se presentan tres caliicaciones, una por sección. Las secciones de Razonamiento verbal y Razonamiento cuantitativo tienen una escala de caliicación
que va de 200 a 800 puntos en incrementos de 10 puntos. La caliicación para
la sección de Escritura analítica se presenta en una escala de 0 a 6 puntos en
incrementos de medio punto. Para una mejor comprensión del desempeño se
presenta el rango percentil asociado a cada una de las caliicaciones (igura 2.4).
Figura 2.4. Hoja para el reporte de calificaciones del
gre
33
34
Validez del gre
En un estudio realizado por Burton y Wang (2005) se muestran dos tipos de
resultados. Primeramente, resultados de validez predictiva comparando la capacidad de los resultados del gre con el gpa para predecir los resultados a largo plazo en el posgrado; en lo anterior se tomaron en cuenta cuatro criterios
por predecir: el gpa acumulado al obtener el grado (cgpa), las caliicaciones
otorgadas por los docentes sobre el dominio de la disciplina, la productividad
profesional y las habilidades de comunicación. Como predictores se utilizaron
la sección verbal del gre (grev), la sección cuantitativa (greq) y el gpa anterior al posgrado (ugpa), y se obtuvieron los siguientes resultados:
• Cuando se combinan los tres predictores la correlación corregida para las
tres caliicaciones de los docentes es de al menos .5.
• Del mismo modo, cuando se combinan los tres predictores la correlación
corregida para el cgpa se estima en alrededor de .5.
• Las correlaciones de las dos secciones del gre combinadas (.40) son casi
tan altas que las de los tres predictores juntos (.49). La mayor contribución
del ugpa es en la predicción del cgpa, lo cual tiene sentido.
En una segunda parte se formulan –en un análisis más detallado– predicciones especíicas por materia y grado (maestría o doctorado) y se encuentran inconsistencias en los datos, atribuidas a características particulares de la muestra.
En otro estudio de Donald E. (Powers, 2004) para el ets, se analizó el uso del
gre para el ingreso a 16 escuelas de veterinaria, en el que resultó una correlación con las caliicaciones del primer año de 0.53 usando las tres caliicaciones; 0.56 si se utiliza el gpa; y 0.72 para ambos indicadores
lsat
Este examen mide las habilidades que son necesarias para lograr el éxito en la escuela de leyes. El Law Schools Admission Test cuenta con más de 50 años de existencia.
Exámenes de ingreso en perspectiva
Estructura del lsat
Se compone de tres áreas: Comprensión de lectura, Razonamiento analítico y
Razonamiento lógico (tabla 2.7).
• Comprensión de lectura. Esta sección mide la capacidad de leer con lucidez
textos largos y complejos como los que se consultan cotidianamente en la
escuela de leyes. Contiene cuatro bloques de lectura y preguntas que consisten en una lectura seleccionada seguida de cinco a ocho preguntas que
miden la capacidad lectora y la comprensión.
• Razonamiento analítico. Diseñada para medir la capacidad de entender una
estructura y desprender las conclusiones. Se solicita al aspirante que haga
deducciones a partir de un conjunto de enunciados, reglas o condiciones
que describen la relación entre personas, lugares, cosas o eventos que simulan la solución de problemas legales a los que se enfrentará.
• Razonamiento lógico. La prueba consiste de dos secciones de 35 minutos cada
una, incluyendo una sección variable que sirve para igualar futuras versiones y no se toma en cuenta para la caliicación de la actual. Esta sección esta
diseñada para evaluar la habilidad de razonar lógicamente y de pensar críticamente mediante el análisis y crítica de una gran variedad de argumentos.
Tabla 2.7. Estructura del
Sección
lsat
Contenido
Número
de reactivos
Tiempo
Comprensión de lectura
Una sección
25-28
35 minutos
Razonamiento analítico
Una sección
24-26
35 minutos
Razonamiento lógico
Dos secciones
22-24
70 minutos
35
Reporte de resultados del lsat
Para reportar las caliicaciones del lsat se transforman los puntajes crudos a
una escala que va de 120 a 180 puntos. Además de la caliicación se presentan
los rangos percentiles para cada candidato.
36
Validez del lsat
Thorton, Reese, Pashley y Dalessandro (2005) evalúan la validez predictiva del
lsat en cuanto al promedio del primer año en la escuela de leyes en grupos
con diferentes condiciones (tiempo extra para contestar el examen, condiciones de aplicación normales y con desventajas como trastorno por déicit
de atención (tda) o problemas de aprendizaje). La muestra consistió en 590
estudiantes de nuevo ingreso de 168 escuelas de leyes cuyos datos fueron recolectados durante un lustro. La medida utilizada para comparar los puntajes
del lsat fue el promedio del primer año en la escuela de leyes (fya); al mismo tiempo se evaluó la validez predictiva del gpa de high school (ugpa), así
como la validez de la combinación de la caliicación del lsat y el ugpa. Los
resultados muestran que:
• La puntuación en el lsat y en el gpa predicen, en conjunto, alrededor de
0.48 del fya.
• Los puntajes del lsat en condiciones normales son comparables aun cuando se hayan presentado otras condiciones (sin incluir aquellas relacionadas
con el tiempo dado para contestar el examen).
• Los puntajes en condiciones de tiempo estandarizado no son comparables
a aquellos obtenidos en condiciones que incluyen tiempo extra.
• Los puntajes en condiciones de tiempo no estandarizado (tiempo extra)
tienden a sobreestimar el fya, por lo que deben tomarse con precaución
sus resultados.
• El ugpa tiende a una sobreestimación del fya, pero es ligeramente menor
que la de la condición anterior.
Exámenes de ingreso en perspectiva
mcat
El Medical College Admission Test (mcat) es un examen estandarizado que consiste en tres secciones de opción múltiple y una sección para evaluar la escritura. Su propósito es evaluar las habilidades y conocimientos considerados
esenciales como prerrequisito para el éxito en la escuela y en la práctica médica. El mcat ha sido parte del proceso de admisión a las escuelas de medicina
por más de 60 años y actualmente todas las escuelas de medicina en Estados
Unidos y la mayoría de ellas en Canadá exigen a los aspirantes presentar puntajes recientes del mcat como parte de los requisitos para la selección. Muchos
otros programas de profesiones de la salud y posgrado aceptan los resultados
del mcat en lugar de otras pruebas estandarizadas (Association of American
Medical College, 2008).
Estructura del mcat
Cada una de las cuatro secciones del mcat se enfoca en la evaluación de la
capacidad de solución de problemas, pensamiento crítico y habilidades generales de escritura; además, en el dominio de los conceptos básicos de biología,
química general y orgánica y física. Las secciones (tabla 2.8) son descritas a
continuación:
• Ciencias biológicas y físicas. Estas secciones evalúan los conocimientos básicos
de física, química y biología y la capacidad de resolver problemas con base
en esos conocimientos. La sección de Ciencias físicas evalúa en el contexto
de física y química general; la de Ciencias biológicas, en el contexto de la
biología y la química orgánica.
• Razonamiento verbal. Requiere la habilidad de comprender, evaluar y utilizar
información y argumentos de un texto en prosa.
• Muestra escrita. Evalúa las habilidades necesarias para desarrollar una idea,
sintetizar conceptos e ideas, presentar ideas lógicamente y escribir clara-
37
mente, con apego a las reglas de la gramática y la sintaxis y manteniendo la
congruencia entre personas y tiempos verbales.
Tabla 2.8. Estructura del
Sección
Ciencias físicas
Razonamiento verbal
Muestra escrita
Ciencias biológicas
38
mcat
Número
de reactivos
Tiempo
52
70
Pasajes de lectura (7)
40
60
Solución de problemas en:
Biología
Química orgánica
52
70
Contenido
Solución de problemas en:
Física
Química
Ensayos (2)
2
60
Reporte de resultados del mcat
El objetivo de todas las secciones del mcat es evaluar las mismas habilidades
y conceptos básicos en diferentes contextos temáticos, pero cada una de las
secciones recibe su propia caliicación (igura 2.5). Las secciones de Ciencias
físicas, Razonamiento verbal y Ciencias biológicas se caliican en una escala de
1 a 15 puntos. La Muestra escrita –que consiste de dos ensayos– se caliica en
una escala de 1 a 6 puntos. Cada ensayo recibe dos caliicaciones y la caliicación de la Muestra escrita es la suma de las cuatro caliicaciones individuales
para obtener un puntaje crudo total que se convierte después a una escala
alfabética que va de J (la caliicación más baja) a T (la más alta).
La suma de las caliicaciones numéricas se reporta como caliicación total
acompañada de la caliicación de la muestra escrita.
Exámenes de ingreso en perspectiva
Figura 2.5. Reporte de calificaciones del
mcat
pcat
El Pharmacy College Admission Test es un examen especializado que ayuda a identiicar a los aspirantes más caliicados al ingreso a escuelas de farmacéutica,
midiendo la habilidad cientíica general y los conocimientos cientíicos necesarios para iniciar la formación farmacéutica.
Estructura del pcat
El pcat se compone de siete subtest que abarcan seis áreas de contenido, descritas a continuación, con un total de 240 reactivos de opción múltiple y dos
tópicos escritos (tabla 2.9):
• Habilidad verbal. Mide el conocimiento y uso general de palabras no cientíicas
mediante el uso de analogías y la tarea de completar enunciados.
• Biología. Mide el conocimiento de principios y conceptos básicos de biología,
abarcando biología general, microbiología, anatomía humana y psicología.
• Química. Mide el conocimiento de principios y conceptos de química inorgánica y de química orgánica elemental.
39
• Lectura de comprensión. Mide la habilidad de comprender, analizar y evaluar
pasajes de lecturas en el contexto de temas relacionados con la ciencia.
• Habilidad cuantitativa. Mide las capacidades en procesos matemáticos y la
habilidad de razonar y entender procesos cuantitativos y relaciones, incluyendo matemáticas básicas, probabilidad y estadística, álgebra, precálculo
y cálculo.
• Escritura. Estos dos subtest miden el uso efectivo de las convenciones del
idioma y la habilidad para sugerir la solución de problemas en forma de un
ensayo escrito.
Tabla 2.9. Estructura del
Sección
40
Habilidad verbal
Biología
Química
Comprensión
de lectura
Habilidad
cuantitativa
Escritura 1
Escritura 2
pcat
Contenido
Analogías
Completar enunciados
Total
Biología general
Microbiología
Anatomía humana
Total
Química inorgánica
Química orgánica
Total
Comprensión
Análisis
Evaluación
Total
Matemáticas básicas
Álgebra
Probabilidad y estadística
Precálculo
Cálculo
Total
Convenciones del lenguaje
Solución de problemas
Convenciones del lenguaje
Solución de problemas
Exámenes de ingreso en perspectiva
Número
de reactivos
60%
40%
48
60%
20%
20%
48
60%
40%
48
30%
40%
30%
6 pasajes y
48 reactivos
15%
20%
20%
22%
22%
48
Tiempo
30 minutos
30 minutos
30 minutos
50 minutos
40 minutos
Ensayo
30 minutos
Ensayo
30 minutos
Existen reactivos de prueba en cada una de las secciones, de modo que
de los 48 reactivos de cada sección, ocho servirán para igualar y conformar
versiones futuras, mientras que los 40 reactivos restantes cuentan para la caliicación del sustentante. De igual forma, uno de los ensayos es experimental y
no cuenta para la caliicación del sustentante.
Reporte de resultados del pcat
La caliicación se reporta en una escala estandarizada de 200 a 600 puntos para
cada una de las secciones de opción múltiple y para un puntaje compuesto que
es el promedio de las caliicaciones de las cinco secciones de opción múltiple.
Paralelamente, se reporta el rango percentil obtenido por el sustentante en
cada subtest y un rango percentil compuesto (igura 2.6).
Para la sección de escritura se otorgan dos caliicaciones: una para convenciones del lenguaje y otra para solución de problemas en una escala que va de
0 a 5 puntos. La caliicación para convenciones del lenguaje se asigna por un
solo revisor, mientras que la caliicación para solución de problemas se asigna
por dos revisores sacando el promedio de ambas caliicaciones.
Figura 2.6. Reporte de calificaciones del
pcat
41
pet
El Psychometric Entrance Test es una prueba desarrollada por el Nacional Institute for Testing and Evaluation (nite). Está compuesta de tres exámenes (Razonamiento verbal, Razonamiento cuantitativo e Inglés) que evalúan habilidades
necesarias en el desempeño académico. Se utiliza para ubicar a los aspirantes
de acuerdo a su probabilidad de éxito en los estudios universitarios. Esta prueba puede presentarse en distintos idiomas (árabe, ruso, francés, español y una
combinación de inglés con hebreo). Para los aspirantes que presentan el pet
en otro idioma diferente del hebreo, existe un examen adicional de aptitud
para el hebreo (nite, s.f.).
42
Estructura del pet
Consta de tres secciones: Razonamiento verbal, Razonamiento cuantitativo e
Inglés. Y una sección adicional para los estudiantes que presentan examen en
un idioma diferente al hebreo (tabla 2.10). Cada una de estas secciones mide
diferentes aspectos requeridos para el ingreso a la universidad.
• Razonamiento verbal. Examina habilidades verbales necesarias para los estudios académicos: vocabulario, procesos de pensamiento lógico, comprensión y análisis de textos complejos; y la habilidad de pensar clara y
metódicamente, mediante el uso de analogías, enunciados incompletos,
preguntas sobre lógica y lectura de comprensión. Todos estos reactivos se
presentan en formato de opción múltiple con cuatro opciones de respuestas.
• Razonamiento cuantitativo. Evalúa las habilidades en el uso de números y conceptos matemáticos en la resolución de problemas cuantitativos, así como
la habilidad de analizar datos en diferentes formatos de presentación,
como son las tablas o gráicas. Sin embargo, sólo es necesario tener conocimientos de matemáticas básicas (10° grado) para responder esta sección.
• Inglés. En esta sección se mide la capacidad del sustentante en el dominio
del idioma inglés mediante su vocabulario y la habilidad de leer y entender
frases complejas en un nivel académico.
Exámenes de ingreso en perspectiva
• Hebreo (opcional). Esta sección es únicamente para los aspirantes que presentan el pet en un idioma diferente al hebreo. Consta de dos partes: una de
opción múltiple y otra de un ensayo que debe escribir el aspirante.
Tabla 2.10. Estructura del
Sección
Razonamiento
verbal (V)
Razonamiento
cuantitativo (Q)
Inglés (E)
Hebreo
(adicional)
pet
Contenido
Analogías
Completar enunciados
Lógica y lectura de comprensión
Preguntas y problemas
Comprensión de gráfica o tabla
Comparaciones cuantitativas y
series de números
Completar enunciados
Replanteamientos
Comprensión de lectura
Completar enunciados y
Replanteamiento
Lectura de comprensión
Número
de reactivos
Tiempo
27
25 minutos
25
25 minutos
27
25 minutos
22
Ensayo
20 minutos
15 minutos
35 minutos
Reporte de resultados del pet
Para calcular el puntaje estandarizado de cada sección se otorga a los aspirantes una tabla de equivalencias entre el puntaje crudo y el puntaje estandarizado
(igura 2.7). Una vez que se obtienen los puntajes estandarizados –en un rango
de caliicación de 50 a 150–, el aspirante puede calcular su puntaje total –en
una escala de 200 a 800 puntos– de la prueba psicométrica, para lo cual debe
obtener primero su puntaje ponderado mediante la siguiente fórmula:
2V + 2Q + E
5
43
Ya obtenido el puntaje ponderado, se utiliza una tabla de equivalencias para
localizar el puntaje total de la prueba psicométrica (igura 2.7). Con otra tabla
se ubica el percentil correspondiente a la caliicación total, de modo que el sustentante puede saber en qué posición de la curva se encuentra su desempeño.
Figura 2.7. Tablas para la obtención de las calificaciones
por área y calificación total del pet
44
sat
El College Board es una asociación no lucrativa entre cuyos objetivos está brindar servicios de admisión a la educación universitaria, consejería, evaluación,
apoyo inanciero, registro, enseñanza y aprendizaje. Uno de los programas de
evaluación del College Board es el Scholastic Aptitude Test (sat), que se ha aplicado
desde 1926.
El sat es uno de los exámenes de mayor uso y aceptación para la admisión a la universidad (Norris, Oppler, Luang, Day & Adams, 2006). Es un
programa de pruebas objetivas y estandarizadas cuyo propósito es medir las
Exámenes de ingreso en perspectiva
capacidades de razonamiento verbal y matemático que los estudiantes han desarrollado, tanto en la escuela como durante su vida cotidiana. Es una prueba
que mide las habilidades de pensamiento crítico necesarias para el éxito en la
universidad y evalúa qué tan bien analiza y resuelve problemas el estudiante.
Diseño del sat
El sat trata de contribuir al cumplimiento de los objetivos de estudiantes,
profesores, consejeros de high school y los equipos de admisión de las universidades. Los reactivos que se incluyen en el examen son semejantes a los que se
presentan en los cursos escolares, ya que se considera que permiten medir el
grado de desarrollo de las habilidades de razonamiento y pensamiento que se
requieren para tener éxito en la universidad y en la vida.
Las pruebas del sat están construidas a partir de reactivos diseñados por
expertos en desarrollo de instrumentos y por profesores de high school y universidad de diferentes partes de Estados Unidos. Algunos profesores interesados
en la construcción del sat envían propuestas de reactivos que son analizados por los expertos para elegir aquellos que pueden ser incluidos. Además,
un comité formado por administradores y miembros del cuerpo docente de
preparatorias y universidades de diferentes orígenes geográicos y étnicos se
encarga de revisar las pruebas para asegurarse que medirán realmente las habilidades y conocimientos de interés.
Cada pregunta es revisada a lo largo de un periodo mínimo de dos años
para asegurar que es útil. Después de dicho proceso de revisión, la pregunta en
cuestión se aplica a manera de ensayo para decidir si puede ser incluida o no
en el sat. Una característica importante de las preguntas que se incluyen en el
sat es su grado de diicultad, por lo que pueden ser clasiicadas como fáciles,
regulares y difíciles. La mayor parte de las preguntas evaluadas son de nivel
regular, lo cual se determina porque entre uno y dos tercios de los estudiantes
las pueden responder correctamente.
45
46
Estructura del sat
El sat consta de tres áreas divididas en 10 secciones, nueve de las cuales evalúan las habilidades de razonamiento en lectura, matemáticas y redacción. La
décima sección tiene propósitos de investigación y diseño, por lo que puede
contener reactivos de cualquiera de las áreas mencionadas y no se consideran
para la evaluación (tabla 2.11). A continuación se describen brevemente las
áreas de la prueba:
• Lectura crítica. Evalúa la capacidad de plantear inferencias, sintetizar información, distinguir entre ideas centrales y complementarias, así como la
comprensión del lenguaje con base en el contexto.
• Matemáticas. Evalúa la interpretación de tablas, gráicas o cuadros mediante
el uso de conceptos matemáticos y habilidades en el manejo de datos.
• Escritura. Contiene preguntas de opción múltiple en relación con la lectura
de un texto; también pide a los aspirantes desarrollar un ensayo para medir
su habilidad de transmitir ideas de forma escrita.
El tiempo total en que los estudiantes deben responder el sat es de 210
minutos, distribuido de la siguiente forma: 70 minutos para lectura crítica, 70
minutos para matemáticas y 60 minutos para la prueba de redacción. Cada una
de las pruebas aplicadas tiene tiempos deinidos para cada sección, los cuales
oscilan entre 10 y 25 minutos. Por ejemplo, el tiempo dedicado a la prueba de
matemáticas se divide en dos secciones de 25 y una de 20 minutos, como se
muestra en la siguiente tabla:
Exámenes de ingreso en perspectiva
Tabla 2.11. Estructura del
Área
Lectura crítica
Matemáticas
Escritura
sat
Contenido
Razonamiento extendido
Comprensión literaria
Vocabulario en contexto
Completar enunciados
Total
Números y operaciones
Álgebra y funciones
Geometría y medición
Análisis de datos, estadística
y probabilidad
Total
Ensayo
Mejora de enunciados
Identificar errores del enunciado
Mejora de párrafos
Total
Número
de reactivos
36-40
4-6
4-6
19
67
11-14
19-22
14-16
5-8
54
1
25
18
6
50
Tiempo
70 minutos en dos
secciones de 25 y una
de 20 minutos
70 minutos en dos
secciones de 25 y una
de 20 minutos
60 minutos, 25 minutos
para el ensayo, dos
secciones de opción
múltiple, una de 25 minutos
y otra de 10 minutos
Además se incluye una sección que no se caliica denominada equating la cual
contiene reactivos piloto que se utilizarán en versiones futuras de la prueba.
Al incluir esta sección para obtener los estadísticos de los nuevos reactivos se
intenta mantener la capacidad de comparación entre las diferentes versiones.
Reporte de resultados del sat
En cuanto a los resultados de la prueba se obtienen tres caliicaciones, una por
cada sección, en una escala que va de 200 a 800 puntos. En la sección de escritura se otorgan dos subcaliicaciones: una para el ensayo (en una escala de 2-12
puntos) y otra para los reactivos de opción múltiple (con una escala de 20-80
puntos). Estas subcaliicaciones se acumulan y transforman para dar la caliicación de la sección de escritura en la escala de 200-800, de la cual el puntaje del
ensayo es de aproximadamente un 30%.
47
El reporte de caliicaciones contiene la comparación del resultado actual
con hasta seis aplicaciones anteriores del estudiante.
48
Validez del sat
En términos de coniabilidad, se ha observado que los estudiantes que presentan en más de una ocasión el sat por lo general obtienen puntajes similares en
cada una de las aplicaciones.
En un estudio hecho con estudiantes de primer ingreso de los años de 1995,
1996 y 1997 de 26 universidades, se consideró que algunas posibles variables
predictivas de las caliicaciones obtenidas por los estudiantes en su primer año
de la universidad son el promedio de la educación preparatoria, los puntajes
para las subescalas verbal y de matemáticas del sat, y las combinaciones de
éstas. Las correlaciones entre cada una de estas variables y el éxito de los estudiantes en su primer año mostraron que la combinación entre ambos puntajes
del sat era la que predecía mejor las caliicaciones de la educación universitaria, ya que presenta la mayor correlación (0.65) (Norris et al., 2006).
Exámenes de ingreso en perspectiva
L
Capítulo 3
Pruebas internacionales de desempeño
as pruebas internacionales no son propiamente utilizadas como parte del
proceso de ingreso a una institución educativa, pero son programas que
–por su reconocimiento internacional– no se pueden dejar de lado. A continuación se presentan las características de dos de las más representativas.
pisa
La Organización para la Cooperación y el Desarrollo Económicos (ocde)
planeó y puso en marcha desde 1997 el Programa para la Evaluación Internacional de los Alumnos ( pisa). pisa es un programa estratégico diseñado
para aplicarse en los países que conforman la ocde y otros muchos que se
han incorporado voluntariamente, a lo largo de varios ciclos trienales desde
el año 2000 hasta el 2015. Este programa de evaluación ha sido desarrollado
para examinar amplias muestras de estudiantes de 15 años de edad (5,000
a 10,000), quienes están cerca de terminar la fase de educación considerada
obligatoria por la mayoría de los países participantes y comparten estructuras
curriculares semejantes.
La aplicación periódica de pisa produce datos que permiten inferir los
logros de los programas educativos en diferentes momentos. Dado que cada
tres años se exploran todas las áreas consideradas en el programa de evaluación, pero sólo alguna de ellas se evalúa de manera extendida, pisa traza un
peril general de tendencia cada tres años y, sólo cada nueve, analiza exhaustivamente los logros en cada una de las áreas consideradas. Hasta ahora se
han aplicado tres ciclos (2000, 2003 y 2006), en cada uno de los cuales se ha
profundizado en la evaluación de un área diferente: la competencia lectora en
2000, la competencia matemática en 2003 y la competencia cientíica en 2006.
Estos son los objetivos principales de pisa: medir el grado de preparación
de los estudiantes para enfrentar los retos en su vida futura y evaluar los logros que han alcanzado; examinar los sistemas educativos de los países miem-
49
bros de la ocde; tener una idea de la calidad de los programas educativos de
cada uno de los países participantes con el in de diseñar políticas adecuadas.
Más especíicamente, pisa evalúa lo que son capaces de hacer los estudiantes con lo que han aprendido hasta ese momento, de ahí que la evaluación
tome como común denominador los currículos nacionales. El proyecto pisa
reúne información acerca de las competencias lectora, matemática y cientíica; de factores familiares, escolares, demográicos, sociales y económicos que
inluyen en el desarrollo de habilidades y actitudes, y analiza cómo interactúan esos factores y cuáles son sus implicaciones en la adopción de pautas de
actuación política.
50
Diseño de pisa
El diseño de pisa es revisado por los diversos participantes en el proyecto
para asegurarse de que sus resultados sean válidos y coniables.
Los países participantes colaboran mediante grupos de expertos para garantizar la validez de los instrumentos de evaluación, su adecuación al contexto cultural y curricular de los países miembros de la ocde y su poder de
medición. Aunque se toman como base las estructuras curriculares comunes
de los países participantes, también se trata de evaluar la forma en que los
estudiantes aplican lo que han aprendido en sus años de educación obligatoria
para superar retos cotidianos.
El diseño de las pruebas del programa de evaluación pisa se centra en las
competencias transversales que implican el manejo de conceptos y habilidades de cada una de las áreas consideradas.
A diferencia de otras pruebas, en especial las de ingreso que se reseñaron
arriba, pisa no está diseñada para dar resultados individuales. En su lugar, se
eligen muestras amplias de sustentantes en el país a los que se aplica un gran
número de reactivos en varios cuadernillos. El conjunto permite hacer, en el
agregado, una exploración más amplia que lo que podría contestar un solo
individuo.
Exámenes de ingreso en perspectiva
Estructura de pisa
pisa no sólo evalúa áreas de conocimientos, también evalúa habilidades cognitivas asociadas de forma importante a cada una de las áreas de interés (lectura,
matemáticas y ciencias), y actitudes (especíicamente, en 2006 se investigó el
interés por las ciencias y la investigación cientíica). Además recolecta información acerca del entorno familiar del estudiante, el enfoque que da a su
aprendizaje, la percepción que tiene de su entorno educativo y su grado de
familiaridad con el uso de las computadoras (ocde, 2006).
Para obtener la información necesaria, el programa de evaluación pisa está
conformado por tres instrumentos de recolección de datos: un cuestionario
para los directores de los centros de enseñanza, un cuestionario contextual
para los estudiantes y un instrumento constituido por tres pruebas que exploran diferentes áreas de competencia (lectora, matemática y cientíica).
• Prueba de competencia lectora. Entendida ésta como la capacidad para comprender, emplear y relexionar sobre textos escritos, con el in de alcanzar
metas personales y desarrollar el conocimiento, así como participar en la
sociedad. Se evalúa con frecuencia mediante textos continuos, es decir,
en prosa. pisa utiliza también textos discontinuos, en los que la información se presenta de otras maneras, como son: listas, formularios, gráicos
o diagramas.
• Prueba de matemáticas. Explora cuatro áreas de contenido (espacio y forma,
cambio y relaciones, cantidad e incertidumbre), cuatro tipos de situaciones
(personal, educativa, pública y cientíica) y tres grupos de capacidades cognitivas (reproducción, conexiones y relexión).
• Prueba de competencia cientíica. La capacidad de extraer conclusiones apropiadas a partir de hechos y datos recibidos, de criticar los argumentos de otros
con base en hechos y de distinguir entre una mera opinión y una airmación sustentada por hechos. La idea de competencia cientíica adoptada por
pisa tiene en cuenta una combinación de formas de pensar y comprender
los aspectos cientíicos del mundo. Se evalúan tres aspectos en esta prueba:
51
conocimientos y conceptos cientíicos a la luz de su empleo en materias
especíicas; procesos cientíicos que implican el conocimiento de la ciencia
sin que éste sea una limitante para poder contestar correctamente; y situaciones o contexto. Aun cuando son tres los aspectos que se tratan separadamente en la evaluación de la competencia cientíica, siempre aparecerá
una combinación de los tres.
Una característica importante es el formato de respuesta: puede ser elección
múltiple, construida-cerrada o construida-abierta. Cada uno de estos formatos
de respuesta representa un tercio de los ejercicios incluidos en la prueba. Los
ejercicios también se pueden presentar como una unidad de análisis en la cual,
a partir de una situación o problemas, se plantean varias preguntas que van de
menor a mayor complejidad.
52
Reporte de resultados de pisa
A partir de las pruebas aplicadas por pisa se obtiene un peril con indicadores
de rendimiento en diversas habilidades y conocimientos de los estudiantes de
15 años, así como posibles relaciones entre esos indicadores y algunas variables personales, educativas, demográicas, económicas y sociales. También se
reportan indicadores de tendencia que muestran la evolución de los resultados
en diferentes periodos.
timss
El Estudio Internacional de Tendencias en Matemáticas y Ciencias (timss) es
un proyecto de la Asociación Internacional para la Evaluación del Rendimiento Educativo (iea). Institución independiente de cooperación internacional,
la iea agrupa a instituciones de investigación nacionales y organismos gubernamentales y ha estado realizando estudios transnacionales de rendimiento
desde 1959.
Exámenes de ingreso en perspectiva
es una prueba que evalúa el desempeño de estudiantes de 4° y 8°
grado en las áreas de ciencia y matemáticas (iea, 2003).
timss
Diseño del timss
Las pruebas del timss se desarrollan mediante un proceso de consenso internacional con el apoyo de expertos en educación, medición, matemáticas y
ciencias.
Las preguntas del timss se centran en las tareas que aportan información
sobre destrezas y capacidades analíticas, de resolución de problemas y de investigación que poseen los estudiantes. El contenido del timss se basa en un
modelo curricular que incluye la evaluación de las oportunidades de aprendizaje disponibles para los estudiantes y cómo la administración de estos inluye
en el aprendizaje. Este modelo incluye tres aspectos: el currículo pretendido,
el currículo aplicado y el currículo obtenido.
El enfoque del timss se basa en técnicas de muestreo matricial, es decir,
se divide el total de los reactivos en diferentes cuadernillos; y cada estudiante
responde sólo uno de estos cuadernillos. Los reactivos se asignan de forma
que se pueda obtener una visión global del rendimiento de la población evaluada a partir de las respuestas de cada estudiante. En otras palabras, ya que el
tiempo requerido para evaluar todos los contenidos curriculares es excesivo,
el timss distribuye los contenidos entre los estudiantes y obtiene resultados
aplicables a la población, pero no a cada individuo (iea, 2003).
Estructura del timss
Las pruebas del timss que responden los estudiantes están formadas por cuatro bloques de reactivos y un cuestionario de contexto. El tiempo que tardan
los estudiantes en responder el cuadernillo de reactivos es de aproximadamente 72 minutos para cuarto grado y de 90 para octavo grado. Además
responden un cuestionario que dura 30 minutos. Las pruebas del timss presentan preguntas de opción múltiple y preguntas abiertas en las cuales los
estudiantes tienen que construir sus propias respuestas. Otra característica
53
54
importante es que las preguntas y tareas no sólo evalúan contenidos temáticos, también exploran las capacidades analíticas y de resolución de problemas
de los estudiantes.
La estructura del timss (tabla 3.1) contiene dos dimensiones generales: la
cognitiva y la de contenidos. Las dos dimensiones y sus dominios constituyen
el fundamento de la evaluación de las matemáticas. Los dominios de contenido deinen la temática especíica cubierta por las pruebas. Los dominios cognitivos deinen los comportamientos esperados de los estudiantes al ocuparse
del contenido de matemáticas. Cada uno de los dominios de contenido tiene
varias áreas temáticas (es decir, “Números” incluye las categorías de números
naturales, fracciones y decimales, enteros, así como razón, proporción y porcentaje). Cada área temática se presenta como una lista de objetivos cubiertos
en la mayoría de los países participantes, bien en cuarto grado o bien en octavo grado.
Del mismo modo para ciencias: los dominios de contenido deinen las
materias especíicas de ciencias cubiertas por la evaluación, mientras que los
dominios cognitivos deinen los conjuntos de comportamientos que se esperan de los estudiantes al abordar el contenido de ciencias. Cada dominio
de contenido tiene varias áreas temáticas principales. Cada área temática se
presenta como una lista de objetivos especíicos de evaluación que son apropiados para cuarto u octavo grado y relejan el currículo de ciencias en esos
grados en la mayoría de los países participantes.
Reporte de resultados del timss
Debido a que cada estudiante responde sólo una porción de los contenidos del
timms, es necesario combinarlas para obtener una visión general de los resultados para cada país. Mediante la teoría de respuesta al ítem (tri), el timms
convierte los resultados a escalas comunes que se enlazan a los resultados
de aplicaciones posteriores para permitirle a cada país un seguimiento de su
rendimiento.
Exámenes de ingreso en perspectiva
Tabla 3.1. Estructura del
Dominio
Contenido
matemáticas
Cognitivo
matemáticas
Contenido
ciencias
Cognitivo
ciencias
timss
Área temática
Números
Álgebra*
Medición
Geometría
Datos
Conocimiento de hechos
y de procedimientos
Utilización de conceptos
Resolución de problemas habituales
Razonamiento
Ciencias de la vida
Física y química
Física
Química
Ciencias de la tierra
Ciencias del medio ambiente
Conocimiento factual
Comprensión conceptual
Razonamiento y análisis
% tiempo
4° grado
% tiempo
8° grado
20%
15%
40%
15%
20%
15%
10%
20%
40%
20%
45%
35%
*
*
20%
*
40%
35%
25%
30%
25%
15%
15%
15%
20%
40%
25%
30%
*
15%
25%
15%
15%
30%
35%
35%
55
E
Capítulo 4
EXANI-I
l Examen Nacional de Ingreso a la Educación Media Superior (exani-i)
es uno de los primeros instrumentos que desarrolló el Ceneval en 1994. Su
antecedente son los trabajos para desarrollar el Examen Diagnóstico Indicativo de Ingreso a la Educación Media Superior (ems) diseñado por la Comisión
Nacional de Educación Media Superior (Conaems) entre 1993 y 1994.
El exani-i está dirigido a estudiantes que han concluido o están por concluir la educación secundaria y desean ingresar a instituciones de educación
media superior. Es una prueba que en su inicio exploraba –en un solo instrumento– habilidades y conocimientos en varias áreas de estudio del nivel medio.
Actualmente, la prueba se compone de dos instrumentos: uno de selección
–que informa del desarrollo de las habilidades que se consideran necesarias
para continuar con los estudios de bachillerato– y otro, de uso opcional, denominado de diagnóstico –que determina el nivel de dominio en los contenidos esenciales de los programas de estudios de la educación secundaria.
Ambos instrumentos ofrecen información importante a las instituciones para
que seleccionen con criterios de desempeño académico a sus estudiantes y
establezcan las medidas necesarias para que éstos alcancen los mínimos requeridos en cada uno de los temas.
antecedentes del exani-i
El propósito inicial del Examen Diagnóstico Indicativo mencionado era “conocer el dominio que los educandos de primer ingreso a la educación media
superior poseen con respecto a habilidades y conocimientos comunes y necesarios para fundamentar la toma de decisiones en la ems” (Hernández, 2004).
Sus características eran las siguientes: un examen integrado por dos áreas de habilidades y conocimientos divididas en 10 secciones: habilidad verbal, habilidad
matemática, matemáticas, física, química, biología, geografía, español, literatura
e historia. Compuesto por 120 reactivos de opción múltiple con cinco opciones de respuesta, sus funciones eran: indicativa, ya que contribuía a identiicar
las características académicas de los alumnos de primer ingreso a las instituciones de bachillerato; diagnóstica, porque permitía establecer los puntos
fuertes y débiles de los educandos, y de retroalimentación, debido a que per-
57
mitía proponer alternativas de solución para articular el ciclo secundario con
el de bachillerato y fortalecer ambos niveles (Hernández, 2004).
Desde su origen el Examen Diagnóstico Indicativo fue concebido como
una prueba estandarizada, objetiva, normativa y de ejecución máxima –lo que
contribuía al diagnóstico de los conocimientos necesarios para el buen desempeño en el ciclo de estudios al que se demandaba el ingreso.
58
evolución del exani-i
A partir de marzo de 1994 el conjunto de reactivos, análisis estadísticos y la
metodología desarrollada por la conaems fueron cedidos al Ceneval, con el
in de que esta instancia elaborara el examen de ingreso a la educación media
superior. Aunque sus objetivos fundamentales permanecen, la estructura del
examen ha experimentado a lo largo de su existencia varios cambios, que
obedecen a la evolución de las ideas y de las necesidades planteadas por las
instituciones usuarias. A continuación se ofrece una vista muy general de la
evolución del exani-i desde 1994 hasta 2008 (tablas 4.1 a 4.4). Más adelante
veremos las nuevas estructuras que operan a partir de 2009.
En 1996 egresa la primera generación que cursó la educación secundaria
con la nueva estructura curricular. Asimismo durante este año se pone en
marcha el Concurso de Ingreso a la Educación Media Superior convocado
por la Comisión Metropolitana de Instituciones Públicas de Educación Media
Superior (Comipems). Las nueve instituciones que la componen deciden emplear el exani-i como el instrumento para la selección de aspirantes.
Estos dos hechos mueven a la redeinición de la estructura y contenidos del
exani-i, tanto en las habilidades como en los contenidos vinculados al currículo.
En 2001 se mantiene la misma estructura que en el periodo 1996-2000;
sin embargo, el nombre y los contenidos de la materia de Civismo cambia por
Formación Cívica y Ética, de conformidad con la modiicación curricular
establecida por la Secretaría de Educación Pública (sep).
Asimismo, en 2002, a solicitud de las instituciones usuarias del exani-i, se
incluye el módulo optativo de Inglés.
Exámenes de ingreso en perspectiva
Tabla 4.1. Estructura del
Áreas
Habilidades
intelectuales
básicas
Conocimientos
disciplinarios
Total de reactivos
Reactivos
por área
%
24
20
96
80
120
100
Tabla 4.2. Estructura del
Áreas
Habilidades
intelectuales
básicas
Conocimientos
disciplinarios
Total de reactivos
Reactivos
por área
%
exani-i
durante el periodo 1994-1995
Subárea
Habilidad
verbal
Habilidad
matemática
Español
Historia
Literatura
Matemáticas
Física
Química
Biología
Geografía
exani-i
Subárea
38
Habilidad
matemática
80
62
128
100
Comprensión de lectura
Sinónimos
Antónimos
Analogías
Sucesiones numéricas
Series espaciales
Patrones espaciales
Problemas de razonamiento
durante el periodo 1996-2000
Habilidad
verbal
48
Sección
Español
Historia
Geografía
Civismo
Matemáticas
Física
Química
Biología
Sección
Comprensión de lectura
Sinónimos
Antónimos
Analogías
Metáforas
Completar enunciados
Sucesiones numéricas
Series espaciales
Patrones numéricos
Patrones espaciales
Problemas aritméticos
Problemas de razonamiento
Reactivos
por sección
4
3
12
3
2
3
3
12
3
3
12
12
12
12
12
12
12
12
120
Reactivos
por sección
10
3
3
24
3
2
3
5
5
4
4
3
3
24
10
10
10
10
10
10
10
10
128
59
Tabla 4.3. Estructura del
Áreas
Habilidades
intelectuales
básicas
Conocimientos
disciplinarios
60
Total de reactivos
Reactivos
por área
32
%
25
96
75
128
100
Módulo de Inglés (Opcional)
Exámenes de ingreso en perspectiva
exani-i
durante el periodo 2002-2006
Subárea
Habilidad
verbal
Habilidad
matemática
Español
Historia
Geografía
Formación
cívica y ética
Matemáticas
Física
Química
Biología
Sección
Comprensión de lectura
Sinónimos
Antónimos
Analogías
Sucesiones numéricas
Series espaciales
Imaginación espacial
Problemas de razonamiento
Reactivos
por sección
7
3
16
3
3
4
4
4
4
16
12
12
12
12
12
12
12
12
128
16
Tabla 4.4. Estructura del
Áreas
Habilidades
intelectuales
básicas
Conocimientos
disciplinarios
Reactivos
por área
%
exani-i
durante el periodo 2007-2008
Subárea
Habilidad
verbal
32
25
Habilidad
matemática
96
Total de reactivos
128
por sección
Módulo de Inglés (Opcional)
75
100
Español
Historia
Geografía
Formación
cívica y ética
Matemáticas
Física
Química
Biología
Sección
Comprensión
de lectura
Sinónimos
Antónimos
Analogías
Sucesiones
numéricas
Series espaciales
Imaginación espacial
Problemas
de razonamiento
Total de reactivos en el examen
Reactivos
por sección
Reactivos
a prueba
(para calificación) (no se califican)
7
3
3
3
16
4
16
2
12
12
12
2
2
2
12
12
12
12
2
2
2
2
4
4
4
4
12
128
16
2
150
22
2
Durante 2007 y 2008, los contenidos y el número de reactivos por caliicar
se mantienen sin cambios; sin embargo, con la inalidad de fortalecer el banco
de reactivos del examen, la estructura pasa de 128 a 150 reactivos, 22 de los
cuales fueron incluidos como preguntas piloto (168 reactivos, si se incluye el
módulo optativo de Inglés).
diseño del exani-i
El proceso de diseño del exani-i ha sido supervisado por un Consejo Técnico, que a su vez nombró a un Comité de Supervisión Académica encargado de
garantizar la pertinencia y calidad de las decisiones respecto al examen. Dicho
61
62
consejo se auxilia con Comités Académicos para la validación del peril referencial y los reactivos del examen. Estos comités se integraron con profesionales, educadores e investigadores de reconocido prestigio tanto en el ámbito de
la evaluación como en el de la educación; estos académicos pertenecen a instituciones nacionales de educación media superior tales como el ipn, Conalep,
Cosnet, Colegio de Bachilleres y la Dirección General de Bachillerato (dgb)
de sep; representantes de las subsecretarías de Educación Básica y de Servicios
del Distrito Federal de la sep, así como representantes de órganos gubernamentales dedicados a la educación en los estados de Aguascalientes, Estado de
México y Tabasco. De igual forma, había un Consejo Técnico para cada uno
de los demás Exámenes Nacionales de Ingreso (exani-ii y exani-iii).
Desde 2007 existe un solo Consejo Técnico, con funciones y tareas similares a los del inicio, que supervisa los tres exámenes de ingreso: exani-i
(ingreso a educación media superior), exani-ii (ingreso a educación superior)
y exani-iii (ingreso al posgrado).
Para este trabajo los académicos toman en cuenta los cambios sociales,
económicos, cientíicos y tecnológicos que inluyen en la educación, los cuales
conducen a una reformulación de los contenidos curriculares que, a su vez, se
relejan necesariamente en la evaluación. Una preocupación actual es que las
competencias adquiridas permitan a los estudiantes continuar con sus estudios o integrarse al mundo laboral.
Las instituciones usuarias del exani-i tienen un papel importante en los
cambios, ya que sus observaciones, inquietudes y necesidades son consideradas en la creación de nuevas estructuras que les permitan tomar mejores
decisiones.
Además, son revisados minuciosamente los planes y programas de estudios (tabla 4.5), y el peril de egreso de la sep, y los rasgos deseables del egresado de educación básica (tales como la utilización de lenguaje, la búsqueda
de información, el razonamiento, el análisis, la argumentación y solución de
problemas, formular preguntas y aprovechar los recursos tecnológicos que le
permitan aumentar sus conocimientos y habilidades).
Exámenes de ingreso en perspectiva
Tabla 4.5. Mapa curricular de la
Primer grado
Español I
Matemáticas I
Ciencias I
(énfasis en
Biología)
sep
Horas
Segundo grado
Horas
Tercer grado
Horas
5
Matemáticas II
5
Matemáticas III
5
5
Español II
6
Geografía de
México y del
Mundo
Ciencias II
(énfasis en
Física)
5
Lengua
Extranjera I
3
Tecnología I
3
Educación
Física I
2
Artes (Música,
Danza, Teatro
o Artes
Visuales)
2
Asignatura
Estatal
3
Total
35
Orientación y
Tutoría
para la educación secundaria
1
5
Español III
5
6
Ciencias III
(énfasis en
Química)
Historia I
4
Historia III
4
Formación
Cívica y Ética I
4
Formación
Cívica y Ética II
4
Educación
Física II
2
Educación
Física III
2
Lengua
Extranjera II
3
Tecnología II
3
Artes (Música,
Danza, Teatro
o Artes
Visuales)
Orientación y
Tutoría
2
1
35
6
Lengua
Extranjera III
3
Tecnología III
3
Artes (Música,
Danza, Teatro
o Artes
Visuales)
Orientación y
Tutoría
2
1
35
El plan de estudios para la educación media favorece (como contenidos
fundamentales) el aprendizaje del español y el de las matemáticas, al darles
presencia durante los tres grados con una buena cantidad de horas semanarias (5), sólo superada por ciencias (6), pero esta última abarca tres áreas: física, química y biología, y como generalmente tiene un carácter experimental,
requiere de mayor tiempo para su enseñanza (sep, 2006).
63
En cuanto a las habilidades que se desarrollan en este ciclo escolar tenemos la capacidad para resolver problemas extrapolando situaciones, comprender textos, hacer inferencias, analogías y deducciones (sep, 2006).
64
Nueva estructura del exani-i
A partir del año 2009 la estructura del exani-i se modiica. Ahora incluye
dos instrumentos con inalidades claramente diferenciadas; un examen de
carácter normativo cuya inalidad es apoyar los procesos de selección de las
instituciones usuarias y otro instrumento cuyo propósito es conocer el nivel
de adquisición de contenidos adquiridos durante la educación secundaria y
que son fundamentales para los aprendizajes en la educación media superior.
Ambos instrumentos son de opción múltiple con cuatro opciones de respuesta, de las cuales solamente una es la correcta. El examen de selección se
estructura con las áreas de habilidades: Razonamiento verbal y Razonamiento matemático, así como con Español y Matemáticas. El examen diagnóstico
se conforma de tres módulos: Ciencias naturales, que incluye Biología, Física
y Química; Ciencias sociales, integrada por Historia, Geografía y Formación
cívica y ética y el módulo de Inglés (tabla 4.6).
Tabla 4.6. Estructura del
Exámenes
De Selección
De Diagnóstico
* Opcional
exani-i
a partir de 2009
Áreas
Razonamiento lógico-matemático
Matemáticas
Razonamiento verbal
Español
Subtotal
Biología
Módulo
de Ciencias Física
Química
naturales
Historia
Módulo
de Ciencias Geografía
Formación Cívica y Ética
sociales
Módulo de Inglés*
Subtotal
Total
Exámenes de ingreso en perspectiva
Reactivos
Reactivos de prueba
20
20
20
20
2
2
2
2
(para calificar)
20
20
20
20
20
20
20
(no se califican)
88
154
242
2
2
2
2
2
2
2
Como se puede observar en la tabla, cada área del examen tiene dos reactivos piloto (no son tomados en cuenta para la caliicación de los sustentantes). Los reactivos con los que se caliican a los sustentantes han pasado por
varias revisiones de carácter técnico por personal del Ceneval, que incluyen
aspectos como: a) la veriicación de correspondencia entre los reactivos y la
población a la que se dirigen, b) que los reactivos evalúen sólo un tema, c) que
no contengan información innecesaria para la resolución de un problema, por
mencionar sólo algunos.
En lo que atañe a la validación externa de los reactivos, un Comité Académico integrado por tres especialistas en cada una de las secciones del examen,
ajeno al Ceneval, procede a la revisión de 16 criterios preestablecidos y tras
una discusión decide si el reactivo es aceptado o descartado. Con los criterios utilizados en esta tarea veriica si el contenido académico corresponde al
examen; por ejemplo, si es relevante, si carece de estereotipos, si se encuentra en el nivel especiicado, y otros más relativos al enunciado del reactivo y
otros tantos sobre las opciones de respuesta. Una vez que los reactivos son
aceptados, pasan por una revisión de estilo que cuida ortografía y puntuación
básicamente.
Todo lo anterior ocurre antes de iniciar el proceso de construcción del examen.
El piloteo y la calibración de los nuevos reactivos se realiza al incorporarlos
en cuadernillos de diferentes versiones del examen (como reactivos piloto).
Los cuadernillos son aplicados a los sustentantes, quienes contestan en hojas
de lectura óptica. Estas hojas son leídas y caliicadas y se emiten y entregan los
resultados. Posteriormente, en una nueva lectura se aplican los criterios para
determinar los estadísticos de cada reactivo en piloteo.
La parte del exani-i de selección integrada por los razonamientos verbal y
matemático, español y matemáticas, es un instrumento con referencia a la norma, es decir, compara el desempeño de cada sustentante con el de toda la población a la que se aplica el examen.
65
66
Los contenidos básicos del examen de selección son los siguientes:
Habilidad de razonamiento verbal. Esta área mide la amplitud del vocabulario
del sustentante (en reactivos de sinónimos, antónimos y analogías), la construcción de oraciones y la comprensión de textos.
Habilidad de razonamiento lógico-matemático. Esta área explora las habilidades
lógico-matemática y espacial. La primera se mide con reactivos de sucesiones
numéricas y problemas de razonamiento y la segunda mide, con reactivos de
series espaciales y de imaginación espacial, la capacidad de percepción visual
(objetos y formas) para realizar transformaciones y modiicaciones.
Asimismo el examen de selección incluye los contenidos de las materias
de Español y Matemáticas que son considerados fundamentales para diversos
aprendizajes en el ciclo de la educación media superior.
La estructura del examen de diagnóstico descansa en los conocimientos
disciplinarios adquiridos durante la secundaria y se divide en Ciencias naturales y Ciencias sociales; cuando las instituciones usuarias lo requieren, se aplica
un módulo de Inglés.
Este instrumento es de carácter criterial, lo cual signiica que cada estudiante es independiente del desempeño de los otros. En este instrumento, el
Consejo Técnico establece los puntos de corte que se relacionan con los conocimientos y habilidades que un estudiante debió adquirir, y su caliicación reiere
si los tiene o no. La interpretación de este instrumento criterial es con respecto
a los puntos de corte establecidos y no con respecto a la población.
Exámenes de ingreso en perspectiva
Tabla 4.7. Estructura del
Exámenes
Razonamiento verbal
Español
Comprensión de lectura
Manejo de vocabulario
Obtención de información
Organización de información
Elementos que intervienen en la coherencia,
la cohesión y la adecuación en los textos
Tipos de textos
Biología
El valor de la biodiversidad
Tecnología y sociedad
Transformación de materia y energía
Nutrición y respiración para el cuidado de la salud
Reproducción y sexualidad
Genética, tecnología y sociedad
Geografía
Historia
Inglés
Química
(para calificar)
Sucesiones numéricas
Series espaciales
Imaginación espacial
Problemas de razonamiento
Significado y uso de los números
Álgebra
Manejo de la información estadística
Formas geométricas
Formación cívica
y ética
Reactivos
Subáreas
Matemáticas
Física
Diagnóstico
a partir de 2009 (Detalle)
Áreas
Razonamiento
lógico-matemático
Selección
exani-i
La formación cívica y ética en el desarrollo social y personal
La dimensión cívica y ética de la convivencia
Identidad e interculturalidad para una ciudadanía democrática
Los adolescentes y sus contextos de convivencia
Principios y valores de la democracia
Participación y ciudadanía democrática
Hacia una ciudadanía informada, comprometida y participativa
Pensar, decidir y actuar para el futuro
El espacio geográfico y los mapas
Geosistemas y ambiente
Dinámica de la población y riesgos
Espacios económicos y desigualdad social
Espacios culturales y políticos
De principios del siglo XVI a principios del siglo XVIII
México en la era global (1970-2000)
Ubicación espacio-temporal
De mediados del siglo XVIII a mediados del siglo XIX
De mediados del siglo XIX a 1920
El mundo entre 1920 y 1960
Décadas recientes
Las culturas prehispánicas y la conformación de Nueva España
Nueva España desde su consolidación hasta la independencia
De la consumación de la Independencia al inicio
de la Revolución Mexicana (1821-1911)
Instituciones revolucionarias y desarrollo económico
(1911-1979)
English
Texts understanding
Las características de los materiales
Estructura y periodicidad de los elementos
La reacción química
Total
(no se califican)
20
2
20
2
20
2
20
2
Total
El movimiento. La descripción de los cambios en la naturaleza
Las fuerzas. La explicación de los cambios
Las interacciones de la materia. Un modelo
para describir lo que no percibimos
Manifestaciones de la estructura interna de la materia
Reactivos
de prueba
88
20
2
20
2
20
2
20
2
20
2
20
2
20
2
154
67
Debido a que la ems en México incluye una gran variedad de opciones educativas para el bachillerato, el exani-i puede aplicarse de siete formas distintas
en atención a las necesidades, características y requerimientos de las instituciones usuarias. Estas opciones de aplicación se detallan en la tabla 4.8.
Tabla 4.8. Opciones de aplicación y duración del
Opciones de aplicación del exani-i
1 Examen de selección (únicamente)
88
Duración
2 hrs.
220
5 h. 15 min.
3 Examen de selección y examen
de diagnóstico, con módulo de Inglés
242
5 h. 45 min.
4 Examen de selección y módulo
de Ciencias naturales
154
3 h. 45 min.
5 Examen de selección y módulo
de Ciencias sociales
154
3 h. 45 min.
6 Examen de selección, módulo
de Ciencias naturales e Inglés
176
4 h. 15 min.
7 Examen de selección, módulo
de Ciencias sociales e Inglés
176
4 h. 55 min.
2 Examen de selección y examen
de diagnóstico, sin módulo de Inglés
68
Total de
reactivos
exani-i
Tiempo
total
Incluye 15
minutos de
receso al
terminar el
Examen de
selección
Reporte de resultados del exani-i
Los resultados del exani-i se emiten en una escala conocida como índice
Ceneval (icne). Esta escala tiene puntajes que van de 700 a 1,300 puntos en
números enteros (Vidal, Leyva, Tristán y Martínez-Rizo, 2000).
Esta escala se obtiene al tomar las puntuaciones (xi) de acuerdo con la
versión presentada, se le resta la media (m) de las puntuaciones de los sustenExámenes de ingreso en perspectiva
tantes y se divide entre la desviación estándar (s). Para calcular una puntuación
estandarizada se utiliza la siguiente fórmula:
Z=(Xi-M)/s
Dado su carácter normativo, el instrumento es diseñado con reactivos cuyo
grado de diicultad está distribuido uniformemente en un rango de 20% a 80%,
lo que permite que los puntajes de la población tengan una distribución normal.
Por lo anterior, este procedimiento se lleva a cabo con la media de 50% y desviación estándar de 16.67% correspondiente a una distribución normal teórica.
Posteriormente se efectúa el cálculo del icne a partir del valor z, de acuerdo
con lo siguiente:
ICNE=100Z + 1000;700 ≤ ICNE ≤ 1300
El valor del icne es redondeado al entero más próximo. Los valores que
exceden los límites del rango de caliicación se limitan imponiendo un valor
mínimo de 700 y uno máximo de 1,300.
Se reporta además de la caliicación global y por tema en icne el percentil
alcanzado en ambos para facilitar a los sustentantes su ubicación con respecto
al grupo en el cual presentaron el examen, así como una gráica comparativa
del grupo de sustentantes y las puntuaciones más altas y más bajas alcanzadas
en este grupo.
Las instituciones usuarias del exani-i hasta 2008 han recibido informes con
gráicos como los siguientes que les permiten obtener la información que requieren. Sin embargo, a partir de 2009 el Ceneval ha desarrollado un software
llamado Sistema Generador de Informes Institucionales (sigii) con el que
cada institución podrá manejar la información de acuerdo con sus necesidades.
En la siguiente gráica se presenta una comparación de los resultados de una
institución “x” con la población total que presenta el examen.
69
Figura 4.1. Comparación entre la distribución de puntajes
de una institución con la distribución nacional del exani-i
70
El siguiente gráico (igura 4.2) muestra los resultados obtenidos en cada
una de las áreas que maneja el examen.
Figura 4.2. Resultados global y por áreas en el exani-i de la institución
Exámenes de ingreso en perspectiva
x
También es posible comparar los resultados obtenidos por género o cualquier otra característica reportada de la población (igura 4.3 y 4.4).
Figura 4.3. Comparación de resultados por género
71
Hombres
Hombres
Mujeres
Mujeres
Todos estos gráicos y otros que sean de interés para los usuarios podrán
ser generados a partir del sigii.
Figura 4.4. Comparación de resultados por régimen
de la escuela de procedencia (público y privado)
72
Pública
Pública
Exámenes de ingreso en perspectiva
Privada
Privada
numeralia 1994-2008
A continuación se ofrece información generada en la Unidad de Proyectos
Especiales de la Dirección General Adjunta de exani sobre el exani-i, desde sus inicios hasta nuestros días. Las cifras corresponden a las aplicaciones
del Examen Metropolitano utilizado en el Valle de México, el de admisión al
Conalep y las demás aplicaciones nacionales.
De 1994 a 1997, siendo director del Ceneval el Mtro. Antonio Gago, se
tuvieron las siguientes cifras:
Examen
exani-i
1994
299,973
1995
395,669
1996
437,737
1997
511,351
De 1998 a 2001, durante el segundo período del Mtro. Antonio Gago, se
tuvieron las siguientes cifras:
Examen
exani-i
1998
504,857
1999
523,052
2000
467,577
2001
493,412
De 2002 a 2005, estando en la Dirección del Ceneval el Dr. Salvador
Malo, se tuvieron las siguientes cifras:
Examen
exani-i
2002
502,379
2003
534,235
2004
567,090
2005
635,785
A partir de 2006, con el Mtro. Rafael Vidal al frente del Ceneval, tenemos
las siguientes cifras:
Examen
exani-i
2006
708,118
El total de exámenes de
8,043,678.
2007
667,240
exani-i
2008
795,203
aplicados desde 1994 hasta 2008 es de
73
74
Validez del EXANI-I
En 1999 se llevó a cabo por cuarto año consecutivo el análisis de validez
predictiva del exani-i el cual reporta las correlaciones entre los resultados
obtenidos en las aplicaciones de 1997 y las caliicaciones obtenidas por una
muestra de sustentantes al concluir el primer año de bachillerato en las instituciones que participaron voluntariamente en el estudio.
Los resultados se obtuvieron con respecto a la muestra en general, por
submuestras y por cada institución participante, tomando en cuenta la situación académica (regular o irregular) de los 5,124 estudiantes que participaron,
de los cuales 3,213 eran alumnos regulares y 1,911 irregulares. También se
tomó en cuenta el género de los estudiantes y el régimen o tipo de escuela de
procedencia.
Los resultados del estudio muestran una correlación alta entre las caliicaciones totales del exani-i y las obtenidas por los estudiantes después del primer
año de bachillerato (0.46) al igual que la obtenida en las dos áreas del examen
(conocimientos, 0.45 y habilidades 0.41), por lo que se airma que la prueba
tiene un buen valor predictivo. Esto se apoya en el hecho de que durante los
cuatro años en que se realizaron estudios de validez predictiva los coeicientes
de correlación del examen aumentaron signiicativamente.
Con respecto al género no hubo diferencias signiicativas entre las correlaciones de las caliicaciones del exani i y las obtenidas al terminar el primer
año de bachillerato, tanto para los estudiantes de género masculino como del
femenino (0.49 y 0.47, respectivamente).
El exani obtuvo coeicientes de correlación signiicativos sin importar el régimen de escuela de procedencia (público o privado), y la diferencia entre los
coeicientes de los regímenes no fue signiicativa (pública, 0.45 y privada, 0.51).
Exámenes de ingreso en perspectiva
Referencias
act (2005). act Scores Are Better Than High School gpa in Predicting Supe-
rior Performance in First Year of College. Recuperado el 21 de febrero de
2008, disponible en: www.act.org/news/releases/2002/09-25-02.html
act (2007). The act: Thecnical manual., disponible en: www.act.org
American Dental Association (2005). User’s manual. Recuperado el 10 de
marzo de 2008, disponible en: www.ada.org
American Dental Association (2007). Validity study 2003 - 2004. Recuperado
el 10 de marzo de 2008, disponible en: www.ada.org
Andrews, K.M. & Ziomek, R.L. (1998). Score gains in retesting with the act
assessment. act. Recuperado el 23 de julio de 2008, disponible en: www.
act.org/research/researchers/reports/pdf/act _RR98-07.pdf
Association of American Medical College (2008). mcat essentials. Washington,
dc: mcat.
Australian Council of Educational Research (2007). gamsat Information booklet. Recuperado el 15 de mayo de 2008, disponible en: www.gamsat.acer.
edu.au
Burton, N.W., & Wang, M. (2005). Predicting long-term success in graduate
school: A collaborative validity study. Educational Testing Service. Recuperado el 11 de marzo de 2008, disponible en: www.ets.org/portal/site/ets/
menuitem
Centro Nacional de Evaluación para la Educación Superior (2008). Metodología
Ceneval. México: Ceneval.
Centro Nacional de Evaluación para la Educación Superior (2009). Guía del
exani-i. México: Ceneval.
Emery, J.L. (2007). A report on the predictive validity of the bmat (2005) for 1st year
examination performance on the Medicine and Veterinary Medicine courses at the University of Cambridge. Cambridge Assessment. Recuperado el 10 de marzo de
2008, disponible en: www.bmat.org.uk
ets (2004). What is the value of the Graduate Record Examinations? Educational Testing Service. Recuperado el 21 de febrero de 2008, disponible en:
www.ets.org/gre
75
76
Hernández, J. (2004). “Origen y desarrollo del exani”. En: Evaluación de la
Educación en México: Indicadores del exani-i. México: Ceneval.
iea (2003). timss assessment frameworks and speciications 2003. recuperado
el 8 de mayo de 2007, disponible en: http://timss.bc.edu/timss2003i/PDF/
t03_af_book.pdf
Kaplan, R.M. & Saccuzzo, D.P. (2006). Pruebas psicológicas: Principios, aplicaciones
y temas. Mexico: Cengage Learning Editores.
Mertler, C.A. (2007). Interpreting standardized test scores: Strategies for data-driven
instrutional decision making. California, ee. uu.: Sage Publications.
National Postsecondary Education Cooperative (2000). The npec sourcebook on
assessment, volume 1: Deinitions and assessment methods for critical thinking, problem solving and writing. Washington, dc: National Center for
Education Statistics.
Nitko, A.J. (2001). Educational assessment of students. Upper Saddle River, nj: Merril Prentice Hall.
Nobel, J. et al. (1999). Relationship between the noncognitive characteristics,
high school course work and grades, and test scores for act-tested students. Recuperado el 8 de agosto de 2008, disponible en: http://www.act.
org/research/researchers/reports/pdf/ACT_RR99-04.pdf
Norris, D. et al. (2006). The College Board sat writing validity study: An
assessment of predictive and incremental validity. New York, ee. uu.:
College Board. No. 2006-2.
powers, d.e. (2004) Validity of Graduate Record Examinations (gre) General Test Score for admissions to Colleges of Veterinary Medicine. Journal
of Applied Psychology: Vol. 89(2) pp. 208-219.
oecd (2006). Assessing cientiic, reading and mathematical literacy: A framework for pisa 2006. recuperado el 14 de mayo de 2007, disponible en:
http://www.oecd.org/dataoecd/63/35/37464175.pdf
Exámenes de ingreso en perspectiva
Secretaría de Educación Pública (2006). Plan de Estudios. Recuperado el 16
de febrero de 2009, disponible en: www.telesecundaria.dgme.sep.gob.mx/
formacion/planestudios2006.pdf
Talento-Miller, E., & Rudner L.M. (2005). gmat validity study summary report for 1997 to 2004. Graduate Management Admission Council. Recuperado el 5 de marzo de 2008, disponible en: http://www.gmac.com/NR/
rdonlyres/C5775E5D-B3C9-420F-A520-3D016E79BC1C/0/RR0506_
VSSSummaryReport.pdf
Thorton, A.E. et al. (2005). Predictive validity of accommodated lsat scores. Technical report. Law School Admission Council. Recuperado el 6 de
marzo de 2008, disponible en: www.eric.ed.gov/contentdelivery/servlet/
ERICServlet?accno=ED469183
Vidal, R. et al. (2000). Manual técnico del Centro Nacional de Evaluación para la Educación Superior. México: Ceneval.
77
El Centro Nacional de Evaluación para la Educación Superior es una asociación civil sin ines
de lucro constituida formalmente el 28 de abril de 1994, como consta en la escritura pública
número 87036 pasada ante la fe del notario 49 del Distrito Federal. Sus órganos de gobierno
son la Asamblea General, el Consejo Directivo y la Dirección General. Su máxima autoridad
es la Asamblea General, cuya integración se presenta a continuación, según el sector al que
pertenecen los asociados, así como los porcentajes que les corresponden en la toma de decisiones (voto ponderado):
Asociaciones e instituciones educativas (40%): Asociación Nacional de Universidades e Instituciones
de Educación Superior, a.c. (anuies); Federación de Instituciones Mexicanas Particulares de
Educación Superior, a.c. (fimpes); Instituto Politécnico Nacional (ipn); Instituto Tecnológico
y de Estudios Superiores de Monterrey (itesm); Universidad Autónoma del Estado de México (uaem); Universidad Autónoma de San Luis Potosí (uaslp); Universidad Autónoma de
Yucatán (uady); Universidad Nacional Autónoma de México (unam); Universidad Popular
Autónoma del Estado de Puebla (upaep); Universidad Tecnológica de México (unitec).
Asociaciones y colegios de profesionales (20%): Barra Mexicana Colegio de Abogados, a.c.; Colegio
Nacional de Actuarios, a.c.; Colegio Nacional de Psicólogos, a.c.; Federación de Colegios y
Asociaciones de Médicos Veterinarios y Zootecnistas de México, a.c.; Instituto Mexicano de
Contadores Públicos, a.c.
Organizaciones productivas y sociales (20%): Academia de Ingeniería, a.c.; Academia Mexicana de
Ciencias, a.c.; Academia Nacional de Medicina, a.c.; Fundación ica, a.c.
Autoridades educativas gubernamentales (20%): Secretaría de Educación Pública.
• Ceneval, a.c.®, exani-i®, exani-ii® son marcas registradas ante la Secretaría de Comercio y Fomento Industrial con el número 478968 del 29 de julio de 1994. egel®, con el
número 628837 del 1 de julio de 1999, y exani-iii®, con el número 628839 del 1 de julio
de 1999.
• Inscrito en el Registro Nacional de Instituciones Cientíicas y Tecnológicas del Consejo
Nacional de Ciencia y Tecnología con el número 506 desde el 10 de marzo de 1995.
• Organismo Certiicador acreditado por el Consejo de Normalización y Certiicación de
Competencia Laboral (conocer) (1998).
• Miembro de la International Association for Educational Assessment.
• Miembro de la European Association of Institutional Research.
• Miembro del Consortium for North American Higher Education Collaboration.
• Miembro del Institutional Management for Higher Education de la ocde.
La publicación de esta obra la realizó
el Centro Nacional de Evaluación
para la Educación Superior, A.C.
Se terminó de imprimir el 31 de julio de 2009
en los talleres de Winkilis, Bugambilias 131,
Col. El Rosario, México, D.F., C.P. 09930,
con un tiraje de 500 ejemplares