La idea que tiene la mayoría sobre un examen se refiere a una prueba que se realiza al final de uno o varios temas explicados por el profesor, practicados en aula con una metodología u otra y teóricamente interiorizados por los alumnos (aunque actualmente se valoran otras muchas cuestiones además de una puntuación única en un momento determinado). Multitud de estudios se han llevado a cabo para dar respuesta a esta pregunta, con la finalidad de entender mejor cómo se produce el aprendizaje de los contenidos curriculares de una manera más eficiente.

¿Son los exámenes eficaces o es un método de evaluación del alumnado obsoleto y en vías de extinción? ¿Miden o infieren lo que un alumno ha aprendido realmente? ¿Sirven para algo más que para puntuar un supuesto conocimiento alcanzado?.

No son respuestas sencillas y necesitas entender unas cuantas cosas antes, pero si quieres unas pocas claves directas ve a ESTRATEGIAS DE APRENDIZAJE MÁS EFECTIVAS EN EL AULA 🔍 y luego vuelve para saber de dónde salen y por qué tienen el mayor consenso científico.

El llamado ‘Efecto de Prueba’ o TESTING EFFECT

Este fenómeno ha sido estudiado por psicólogos cognitivos a lo largo de los años, pero a partir de la década de los 80 hay poca literatura y rara vez se ha aplicado con la intención de extrapolar los resultados al ámbito educativo.

El mismo William James argumentó a finales del siglo XIX en su obra ‘Los Principios de la Psicología’ : «las cosas se quedan mejor por la repetición activa que pasiva… al aprender, cuando casi conocemos el contenido, es mejor esperar y recordar que mirar el libro de nuevo». De la misma opinión eran Abbott en 1909 y Thorndike en 1914 con sus respectivas investigaciones, mencionado este último como referente en PSICOLOGÍA EDUCATIVA 🔍.

Más actualizados son los estudios de dos importantes investigadores, Roediger y Karpicke, que hicieron una revisión exhaustiva de la literatura a lo largo del siglo XX y llegaron a conclusiones interesantes y de no tan difícil aplicación en las aulas. En muchos de los experimentos que describen, un grupo de estudiantes debía aprender una serie de cuestiones que eran «evaluadas» con una prueba inicial e incluso con varias repetidas. La retención del material se determinó con una prueba de criterio final y el rendimiento del grupo que realizaba exámenes se comparó con uno o dos grupos de control.

  • En un tipo de control, los estudiantes estudiaron el material y realizaron el examen final, pero no se les dio una prueba inicial como al otro grupo.
  • En un segundo tipo de control, los estudiantes estudiaron el material pero luego volvieron a reestudiarlo una segunda vez mientras el primer grupo recibía la prueba inicial; el tiempo total de exposición al material se equiparó para los grupos de ensayo y de control.

¿Superará el grupo de ensayo a ambos tipos de grupos de control en la prueba final? ¿Influye el hecho de que los estudiantes reciban retroalimentación por parte del profesor sobre los resultados de la prueba inicial?. En variaciones de este experimento se han investigado los efectos de otras variables como el tipo de material a aprender, el formato de las pruebas o el intervalo de retención antes de la prueba final. La idea es ver si el resultado es robusto a través de una amplia variedad de contextos.

El examen como una HERRAMIENTA DE ENSEÑANZA

Gates (1917) y Spitzer (1939) publicaron dos estudios clásicos que muestran fuertes efectos positivos de los exámenes o pruebas en la retención, siendo el primero quien llevó a cabo un estudio pionero a gran escala con niños de diversos grados y utilizando dos tipos diferentes de materiales: sílabas sin sentido y biografías breves.

Los niños estudiaron estos materiales durante un procedimiento de aprendizaje de dos fases:

  • En la primera fase se leen el contenido a sí mismos.
  • En la segunda fase el experimentador les instruyó para tratar de recordar la información (recitación encubierta) sin el material delante, aunque se les permitió echar un vistazo cuando necesitaban refrescar sus recuerdos. Aunque esta característica del diseño relajó el control experimental, probablemente capturó fielmente lo que los estudiantes hacen en una condición u otra a la hora de estudiar.

Gates manipuló la cantidad de tiempo que los niños pasaban recitándose el contenido a sí mismos, haciendo que dejaran de leer y comenzaran a recuperar la información después de intervalos de tiempo distintos. Al final del período les hizo una prueba pidiéndoles que escribieran todo el material que pudieran recordar en orden de aparición. Luego volvió a examinar a los niños de 3 a 4 horas más tarde.

✔️ En las sílabas sin sentido, todos los grupos excepto los de primer grado (a tener en cuenta que estos niños mostraban aún habilidades de lectura pobres), mostraron un fuerte efecto cuando debían recuperar la información y no sólo estudiarla.

✔️ Cuando el material eran las biografías breves, todos los grupos mostraron también el mismo efecto, aunque no fue tan robusto en las pruebas iniciales como en aquellas que se hacían posteriormente.

En dicho artículo se concluye que los intentos de recordar durante el aprendizaje son una buena manera de promover éste y que los resultados tenían importantes implicaciones para la práctica educativa, por lo que describió formas de incorporar esa metodología en los ejercicios de clase.

Sin embargo, el trabajo de Gates también señaló las limitaciones referidas a los estudiantes de primer grado que no mostraron el efecto, lo que sugiere que puede ocurrir sólo después de un cierto punto de desarrollo. Otro punto es que, con los pasajes en prosa, el efecto de la autorrecuperación se estabilizó e incluso pareció disminuir cuando la cantidad de tiempo dedicado superó el 60%, y en consecuencia el tiempo de estudio fue inferior al 40%. Por lo tanto, los datos sugieren que una cierta cantidad de estudio puede ser necesaria antes de un examen para que influya sobre el aprendizaje de los contenidos.

En el estudio de Spitzer se utilizó a toda la población de estudiantes de sexto grado en 91 escuelas de primaria a lo largo de nueve ciudades en Iowa; un total de 3.605 estudiantes. El experimento consistió en que estudiaran material de 600 palabras que era similar al que se podían encontrar en la escuela y luego fueron examinados de acuerdo a varios horarios durante los siguientes dos meses. Cada una de las evaluaciones constaba de 25 ítems de opción múltiple con cinco alternativas de respuesta. Algunos estudiantes realizaron un sólo examen dos meses después, mientras que otros hicieron además varias pruebas anteriores para ver qué efecto tendrían en el examen final.

Se pudieron discernir varios patrones interesantes en los resultados:

  • Cuanto más tiempo se retrasó la primera prueba, peor fue el rendimiento en la misma.
  • El hecho de realizar un examen casi consiguió que no se produjese un efecto de olvido. Es decir, cuando a los estudiantes se les dio una primera prueba y luego se les volvió a examinar en un momento posterior, su rendimiento no sólo no cayó sino que en ocasiones incluso mejoró.
  • Cuanto antes se realice la prueba inicial después del estudio, mejores resultados tendrán los estudiantes en las pruebas posteriores.

La lección del estudio de Spitzer es que una primera prueba (sin retroalimentación siquiera) debe ser administrada poco tiempo después del estudio (cuando el estudiante todavía puede recordar o reconocer el material) con el fin de tener un efecto positivo en un momento posterior.

Los trabajos de Gates y Spitzer se encontraban entre los más extensos de su época, aunque hay otro también exhaustivo y del que se han hecho eco posteriormente numerosos autores para sus propias investigaciones.

Cierto es que algunas de las características de las técnicas experimentales de estos dos estudios no aguantarían los estándares de calidad de hoy, pero los puntos esenciales han sido replicados posteriormente en numerosas ocasiones.

1️⃣ Forlano replicó el estudio de Gates y demostró que las pruebas mejoran no sólo el aprendizaje sino también la ortografía de las palabras que forman parte del vocabulario de los niños.

2️⃣ Sones y Stroud replicaron el estudio de Spitzer aunque a menor escala.

¿Se repetirán los resultados en estudios posteriores? ¿Qué otras variables pueden influir en la mayor o menor eficiencia en el aprendizaje de los contenidos? ¿Por qué a menudo se «olvida» lo estudiado una vez realizado el examen? ¿Es importante dar feedback a los estudiantes sobre los resultados de las pruebas? A estas y otras preguntas contesto en las siguientes entradas relacionadas, empezando por CÓMO UTILIZAR UN EXAMEN PARA APRENDER 🔍.

Tags:

No responses yet

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *