Evaluación para todos
En la entrega anterior se presentan limitaciones de la forma en que los docentes suelen evaluar el aprendizaje de sus alumnos. Se advierte que las fallas se deben, en parte, a lagunas de la formación inicial, en la que se trabaja poco el tema de evaluación, a veces siguiendo ideas obsoletas como las de calificar por curva.
Esta expresión remite a lo que se llama calificar con referencia a una norma estadística, que implica comparar el rendimiento de un alumno con el de los demás, para luego asignar la calificación máxima (10) al alumno o alumnos de mejor desempeño, sea cual sea este, y las notas siguientes (9, 8, 7…) a los demás, cuidando que la mayoría tenga la calificación intermedia (8), un número menor 7 y 9, y unos cuantos 10 (los mejores) y 6 (los de menor rendimiento). En unos casos las políticas establecen que no se debe dar calificación reprobatoria (5) a nadie, en especial al inicio de la primaria, y en otros casos tal cosa se acepta. Con esta forma de calificar es posible hacer un ordenamiento de los estudiantes, del que tenga mejor rendimiento al que lo tenga más bajo: los de 10, los de 9, etc.
Pese a la impresión de exactitud y objetividad que da el uso de números al calificar, la manera en que se llega a ellos es, por lo general, muy inadecuada:
- Se elabora un examen con preguntas de opción múltiple, falso-verdadero o similares.
- Se revisan las respuestas de los alumnos y se marcan las correctas y las incorrectas.
- Se cuentan los aciertos y se asigna una nota según el porcentaje del total que representan. Si la nota máxima es 10, esa corresponde al 100% de aciertos, 9 al 90%, etc.
Esta manera de asignar una calificación tiene una dosis muy alta de arbitrariedad, al grado de que tener 10 o 6 no dice gran cosa. Por una parte, no es fácil redactar buenas preguntas de respuesta estructurada, que no tengan ambigüedades o inexactitudes que induzcan a error, pero aún si todas las preguntas están bien hechas no es correcto asignar una calificación con base en la proporción de aciertos y errores: si las preguntas son fáciles, acertar todas las respuestas no dice gran cosa; si son muy difíciles tampoco dice mucho el que un alumno tenga pocos aciertos.
No es claro cómo definir el balance adecuado de preguntas de dificultad alta, media o baja. ¡Un maestro estricto puede elaborar una prueba en la que ninguno de los alumnos alcance una nota aprobatoria, y uno muy laxo puede hacer otra en la que todos tengan 9 o 10!
Por otra parte, con preguntas de opción múltiple o similares, solo puede cubrirse una parte de los contenidos que se deberían considerar, y hay que dejar fuera los que tienen que ver con comprensiones complejas, razonamiento, inferencia, pensamiento crítico, etc.
Además, suponiendo que todo se haga bien y lleguemos a un ordenamiento sólido de los estudiantes de un grupo, del de mejor rendimiento al de más bajo, con este tipo de pruebas solo podemos concluir que los de 10 manejan los contenidos de la prueba mejor que los de 9, y estos que los de 8, etc., pero no podemos decir si los de 10 saben lo que hay que saber.
En otras palabras, una calificación con referencia a una norma estadística solo permite hacer juicios de valor relativos, en términos de mejor o peor. Para llegar a un juicio absoluto hay que calificar con respecto a un criterio, lo que permite decir si el rendimiento de un estudiante es bueno o malo en relación con ese criterio, si alcanzó o no el aprendizaje que se esperaba lograra.
La tarea del maestro no es igual a la de un entrenador de alto rendimiento. Este debe preparar unos cuantos atletas sobresalientes para que consigan medallas. Los docentes, en especial de educación básica, deben buscar que todos los alumnos alcancen un nivel mínimo adecuado. Por ello a los entrenadores les interesa ordenar a sus pupilos, según su rendimiento. Comparándolos entre sí se puede definir un orden, según el lugar que ocupen (1°, 2°, 3°…) pero sin conocer la distancia que separa unos de otros, el intervalo. La diferencia entre el 1° y el 2° o el 50° puede ser muy grande o muy pequeña; no lo sabemos. Esto permite al entrenador centrar la atención en los mejores, que son los que pueden aspirar a ser medallistas en las competencias, sin que importe mucho lo que pase con los de rendimiento medio o bajo.
En el caso de los maestros, su propósito al enseñar debe ser lograr que todos los alumnos alcancen un nivel mínimo en el dominio de ciertos aprendizajes. Para ello es necesaria una evaluación con referencia a un criterio (criterial) que se obtiene comparando a los alumnos no entre sí, sino con un estándar preciso, -el criterio- que no es otro que el mínimo que el currículo establece como aceptable en el dominio de los aprendizajes esperados que los alumnos deben manejar. Así es posible saber cuántos de los sujetos cumplen o no con el estándar: si lo cumplen muchos, la escuela estará consiguiendo sus propósitos; si son pocos, será indicio de problemas. En otras palabras, será posible llegar a juicios en términos absolutos, de bueno o malo. No importará que no podamos ordenar uno a uno a los estudiantes según el grado en que alcanzan esos aprendizajes, y la distribución no tendrá por qué ajustarse a curva normal.
Un ordenamiento basado en el puntaje obtenido por los jóvenes de varios países en la prueba PISA de la OCDE es un ejemplo de los límites de los juicios de valor relativos que pueden hacerse. En la escala de ciencias de PISA 2006 los chicos de Finlandia alcanzaron 563 puntos; los de Canadá 534; los de Estados Unidos 489; los españoles 488; los chilenos 438; los mexicanos 410; los argentinos 391; los de Brasil 390; y los de Colombia 388. ¿Es bueno o malo estar mejor o peor que esos países? Ser mejor que uno muy malo puede ser malo, y ser peor que uno muy bueno puede ser bueno.
Una evaluación hecha con referencia a un criterio, en cambio, permite llegar a juicios absolutos. En la prueba de ciencias de PISA 2006 se definió un puntaje de 409.5 como el mínimo aceptable para desenvolverse en una sociedad con una economía competitiva e instituciones democráticas. La proporción de chicos que alcanzaron ese puntaje o lo superaron en Finlandia fue 95.9%; en Canadá, 90%; en España, 80.4%; en Estados Unidos, 75.6%; en Chile, 60.2%; en México, 49%; en Argentina, 43.8%; en Brasil, 39.0%; en Colombia, 39.8%. Países como Finlandia o Canadá, en que los chicos por debajo del nivel mínimo son pocos, están claramente en una situación buena; México, donde poco más de la mitad de los jóvenes (51%) no alcanza ese nivel mínimo, sin duda no está bien, independientemente del lugar que ocupe en el ordenamiento de los países que participan en PISA.
¿Qué implica calificar respecto a un criterio?
- Ante todo, precisar el estándar -criterio- que establece lo que los alumnos deberán saber.
- Luego, precisar qué debe hacer o responder un alumno para mostrar que sabe lo estipulado.
- Enseguida diseñar evaluaciones en que el alumno pueda mostrar eso. Podrá ser una prueba con ítems de opción múltiple, o trabajos más amplios, como un proyecto.
- Y precisar qué tipo de respuesta o producto será considerado evidencia adecuada de que se ha alcanzado un estándar.
Hay que añadir que lo anterior no necesariamente implica que haya una calificación numérica, que puede ser incluso engañosa y dar lugar a injusticias, si es el resultado de una alquimia no consistente como se ha sugerido antes. Si la nota numérica resulta de un proceso sólido, eso no ocurrirá, pero probablemente el alumno sólo entienda el sentido sumativo y no consiga saber qué debe hacer para mejorar. Un sistema de evaluación que precise lo que el alumno deberá hacer para mostrar que alcanzó el aprendizaje esperado es preferible, tanto con propósito sumativo como, sobre todo, formativo, lo que será objeto de reflexión en la siguiente entrega de esta columna.
Debe subrayarse, por último, que lo importante no es si la calificación se expresa con letras o con números; el símbolo no es el problema, sino la falta de puntos de referencia estables y claros. Creer que se mejora el sistema de calificaciones cambiando de números a letras o viceversa es no entender que el problema es usar números sin sentido para resumir desempeños complejos.
Tanto por razones administrativas, como por las exigencias usuales de los padres de familia, no es realista pensar en suprimir las calificaciones numéricas. Si se ha comprendido lo anterior se entenderá también que lo importante es dar sentido a la nota, llegar a ella racionalmente, y explicar bien tanto a los chicos como a sus padres lo que quiere decir, para que el enfoque formativo prevalezca sobre el sumativo.
Comentarios
Publicar un comentario