You are on page 1of 25

Universidad del Valle de Guatemala

Facultad de Educación
Maestría en Educación

Libros de Evaluación

Evaluación de los Aprendizajes


Lic. Fernando Rubio

Amalia Ruballos
Carné 01 513

Guatemala, 03 de octubre de 2008


1. Glaser presenta las características de una prueba referida a criterio.
En ese sentido:
a. Características de las Pruebas Referidas a Criterio:
Una prueba referida a criterio es aquella que se construye para presentar
resultados directamente interpretables. Es decir, se refiere a los logros de los
estudiantes con respecto a las metas (objetivos de aprendizaje) o las
competencias que el sistema persigue que éstos alcancen, en este caso los
puntajes tienen sentido absoluto en función del dominio que ha sido medido en
la prueba.

Cuando se usa pruebas referidas a criterio tiene un significado algo diferente


con respecto a medidas educativas o psicológicas. Uno de estos usos involucra
la noción que anota en un logro que mide el instrumento (X) y se correlacione
con los resultados de una segunda situación de la medida (Y). Una segunda
interpretación prevaleciente del término criterio en la medida de logro involucra
la imposición de una magnitud de los resultados aceptables como un índice de
logro. A menudo se aplican ambas concepciones del término criterio a un solo
instrumento de la medición: Una prueba puede servir para seleccionar a los
estudiantes desde un punteo de corte de acuerdo a los resultados obtenidos.

b. Contraponga las pruebas referidas a criterio a las pruebas referidas a


normas. Incluya ámbitos de aplicación de cada una (Garvin), ventajas y
desventajas de cada una.

La principal preocupación es medir el logro de los objetivos educacionales; la


medida no es un fin en sí misma; y no se dirige la instrucción sólo para medir
su efecto. Así mismo, la instrucción tampoco es un fin, pues el objetivo de toda
instrucción es cambiar la probabilidad entre las alternativas de respuesta en un
proceso. La diferencia sustancial entre las pruebas referidas a criterio y a
norma es que la primera provee información de los conocimientos y aplicación
de habilidades específicas y personales mientras que las referidas a norma se
limitan a la clasificación dentro de un grupo de personas o bien a la clasificación
entre grupos.

Las pruebas referidas a criterio son utilizadas por ejemplo en una prueba de
habilidad mecanográfica un estudiante puede escribir 150 palabras en un
minuto, entonces se puede decir que ha pasado la prueba y que se tiene
información sobre su habilidad que se puede relacionar, pero no
necesariamente tiene que relacionarse, con el rendimiento de otros estudiantes
en la misma prueba.

Otro ejemplo es el reclutamiento de personal, en el cual se requiere un


determinado número de habilidades y destrezas y no solamente los
conocimientos sino la aplicación de los mismos. Por otro lado, las pruebas
referidas a la norma, si una persona compara las habilidades entre las personas
de un mismo grupo no es la herramienta idónea para certificar un cierto nivel de
competencia, sino la comparación contra un grupo de especificaciones o
estándares.

Un examen de matemáticas producía un puntaje en un rango del 0 al 100 que


probablemente no diría nada explícitamente sobre el nivel de matemática
adquirido por el estudiante que obtenía un puntaje de 50, tan sólo dice que él
conoce más matemáticas que otros estudiantes que tienen un puntaje de 40,
pero menos que un tercero que tuvo un puntaje de 70. La información de las
pruebas referidas a norma es valiosa cuando interesa la agrupación de
estudiantes en determinados cursos o para dar un rango a los alumnos en
algún orden de mérito. También pueden usarse para contrastar grupos.

La naturaleza de la información proporcionada por los tests referidos a normas,


es esencialmente cuantitativa; pero las cantidades expresadas en términos de
los puntajes del test no pueden ser inmediatamente transformados en
cantidades de aprendizaje.
Sin embargo, las pruebas referidas a criterio están orientadas a brindar una
información más personal y cualitativa, es decir, si una persona tiene las
características idóneas para ejercer un puesto o trabajo enfocado
específicamente en lo que la persona puede hacer. Las ventajas de la
evaluación por criterio se deben a que tienen una mejor interpretación para la
toma de decisiones. No debería hacerse análisis cruzados de norma y criterio.
Ya que las referidas a norma no toman en cuenta la relativa habilidad.

c. Popham y Husek examinan las implicaciones técnicas de las pruebas


referidas a criterio. Brevemente, resúmalas

La diferencia entre una prueba referida a norma y una prueba referida a criterio
no puede definirse fácilmente por la descripción de un instrumento particular.
La distinción se encuentra en:

a) el propósito para el cual la prueba fue construida


b) la manera con la que fue construida
c) la especificidad de la información sobre el dominio de tareas pertinentes,
d) la generalización de información de actuación de prueba al dominio, y
e) el uso de la información de la prueba obtenida.

De allí las pruebas referidas a criterio no solamente asume el reto de resumir la


actuación de un estudiante en una prueba, sino también cómo asegurar que la
prueba se construyó de una manera apropiada a su uso, aun cuando su uso
no es convencional

La Distinción Básica no es posible; diferenciar una prueba de criterio de una


prueba referida a norma solamente viéndola puede ser confuso. De hecho una
prueba de referida a criterio puede ser usada como referida a norma que se
usan para determinar la actuación de una persona en relación a la actuación
de otros individuos en el mismo instrumento de la medición, porque el individuo
se compara con algún grupo normativo como se describen las tales medidas.
La mayoría de pruebas estandarizadas pueden ser clasificadas como referidas
a norma. Sin embargo, las referías a criterio se usan para determinar el estado
de una persona con respecto a algún criterio, debido a que interesa lo que él
puede hacer y no como se compara con los otros.

Si en las pruebas referidas a norma se utilizan medidas para facilitar las


comparaciones entre individuos, no es sorprendente que su propósito primario
sea tomar decisiones individuales. La toma de decisiones con respecto a una
persona puede hacerse más fácilmente si sabiendo más sobre las otras
personas y cómo él puede compararse. Una característica importante es que la
varianza obtenida por estos tests debe ser grande para permitir comparaciones
entre individuos. Para poder ampliar la varianza los evaluadores se valen de
ciertas técnicas entre las cuales está el índice de discriminación que permite
conocer la relación entre el desempeño de un ítem aislado con el desempeño
en el test completo. El problemas, por lo general, es que estas pruebas no son
sensibles a diferencias culturales pudiendo afectar así a muchos alumnos como
consecuencia de las decisiones tomadas que consideraron sus diferencias
culturales.

Las pruebas referidas a criterio se emplean para hacer ambas estimaciones,


grupales e individuales; en el caso de decisiones con respecto a los individuos
uno podría usar una prueba referida a criterio para determinar si un estudiante
había dominado una habilidad que se considera requisito previo para
comenzar un nuevo programa.

La variabilidad
El problema de variabilidad está en el centro entre una prueba referida a norma
y una referida a criterio. Desde el significado más profundo una prueba
referida a norma el puntaje es básicamente dependiente en la posición relativa
comparado con otros, mayor variabilidad en los puntajes es mejor. Con las
pruebas criterio la variabilidad es no pertinente. El significado del puntaje no
es dependiente en la comparación con otros puntajes.

Construcción de Items
Su regla principal es asegurarse que el ítem sea reflexión exacta de la conducta
del criterio. Difícil o fácil, que distingue exactamente o no, lo más importante es
hacer que el ítem presente las conductas delimitadas por el criterio. Las
personas que redactan ítem de construcción usualmente se aseguran de definir
claramente el dominio.

Fiabilidad
La prueba debe ser internamente consistente. Si se determina que los ítems
se atan a un criterio, entonces todos los ítems deben ser bastante similares.

La validez
Las pruebas referidas a criterio son basadas en la relevancia clara de la prueba
a las conductas legítimas.

Análisis de ítems
Por ejemplo, en una prueba de logro un ítem no satisfactorio sería uno que no
discrimina entre el mejor y el menor conocedor de los estudiantes. Los ítems
que discriminan normalmente son demasiado fáciles, demasiados duros y/o
ambiguos.

Para pruebas de criterio los índices de discriminación deben modificarse. Un


ítem que no discrimina se elimina. Si refleja un atributo importante del criterio,
tal ítem debe permanecer en la prueba. Pensando en valor de un ítem
identificado como un discriminador negativo. Podría ser que un poco de
deficiencias en la instrucción causó el resultado en lugar de cualquier falta del
ítem. Todavía, más probablemente es que el ítem sea deficiente.

Reporte e Interpretación
Se han utilizado conceptos de pruebas referidas a norma y pruebas referidas a
criterio, para tomar decisiones sobre los individuos y tratamientos. Por
consiguiente, se necesita interpretar la prueba apropiadamente para tomar la
mejor decisión. Interesa el comportamiento de un individuo respecto a la
actuación de otros. Al interpretar los resultados de un individuo frente una
prueba referida a criterio, sin embargo, los tales índices no son apropiados.

Tipos diferentes de Pruebas referidas a criterio


Los dos tipos son un caso ideal y un caso típico. En el caso ideal los ítems se
atan no sólo al criterio pero, además, la prueba. Todos los que han conseguido
el mismo resultado en una prueba los han conseguido de la misma manera. El
significado de un resultado en sí es inequívoco. Sin embargo, este tipo de
prueba es todavía un sueño.

El otro tipo de prueba es más típico, los ítems en la prueba son una muestra
de la potencialidad del grupo que podría generarse de un criterio, el resultado
en la prueba no es completamente inequívoco, si nosotros sabemos que un
estudiante ganó una nota de 90 por ciento sabemos qué el estudiante fallo un
diez por ciento. Si la prueba es homogénea, esto nos dice apropiadamente lo
que el estudiante puede hacer.

d. Usando el punto anterior, examine las prácticas de evaluación de


aprendizaje usada en nuestro medio. Pueden o no considerase como
pruebas referidas a criterio las pruebas usadas rutinariamente en el
aula. ¿Por qué?
No, pues considero que las pruebas no determinan con exactitud lo que el
estudiante es capaz de hacer, es decir, el nivel de conocimiento no determina
que éstos puedan ser llevados a la práctica que es lo más caracteriza a las
pruebas de criterio.

Además es importante subrayar que no se pueden considerar de criterio


porque los resultados obtenidos son puramente cuantitativos pues no reportan
las cualidades del estudiante sino la cantidad en la que se encuentra su
conocimiento y la aplicabilidad de éste. Las pruebas de clase son una muestra
del total de conocimientos impartidos. No es posible medir todos los
conocimientos. Esto lleva a centrarse relativamente a una referencia a norma.
(The true about the testing, Popham)
2. Popham (The truth of testing) y Kohn (The case against standardize
testing) debaten sobre el uso de pruebas de alto impacto o altas
implicancias (high stakes testing).

a. Popham
Las consideraciones más serias en la creación y uso de los programas de
pruebas de alto impacto son, si las pruebas que están siendo empleadas
actualmente ayudan o entorpecen la calidad de educación que los niños
reciben. Además cree que es posible unificar y crear un amplio programa
estatal de pruebas de alto impacto, que puede de forma simultánea proveer
evidencia de la calidad de las escuelas estatales y ayudar a los maestros a
promover en los estudiantes el verdadero dominio de destrezas y
conocimientos.

El reto consiste en emplear test educativos que cumplan con la función de


responsabilidad además de proveer a los maestros objetivos de instrucción
adecuados. El utilizar programas de evaluación en donde se incluyan de
forma correcta las diversas clases de pruebas de alto impacto, sería una
contribución significativa para la calidad de educación que reciben nuestros
niños. Dado a la baja calidad de las pruebas de alto impacto actuales, los
estudiantes se ven más afectados de forma negativa que de forma positiva.
Además, actualmente la mayoría de pruebas de alto impacto son mal
utilizadas y que su uso afecta la calidad de enseñanza de los estudiantes.

b. Kohn.
Considera que este tipo de pruebas no permite que los estudiantes muestren
lo que pueden hacer con lo que saben. Para él no todas las pruebas son igual
de malas, e incluso los menos útiles o el más perjudicial de los programas de
evaluación incluyen:
• Una norma de referencia en la que los estudiantes deben contestar.
• Preguntas de opción múltiple.
• Un determinado período de tiempo.
• Hacerlo repetidamente
• Pasarla en los primeros grados

Considera que no se ha encontrado mucha evidencia sobre el efecto de las


pruebas, pero que un hallazgo importante es el hecho de que los niños sean
usados como efectos de experimento. Además, los docentes se sienten
presionados cuando se les pide que cumplan con estándares y conduce a los
mismos a tomar decisiones como: que se copien los estudiantes en las
pruebas, que estar a la defensiva, renunciar a su trabajo y en el mejor de los
casos ser más competitivos.

Menciona que la consecuencia más significativa es que este tipo de pruebas


han idealizado que “aprender para la prueba” se convierta en un objetivo
prioritario y eso hace que la mayoría de las veces:
• Las pruebas se convierten en un currículo.
• Algunas veces los punteos altos en las pruebas estandarizadas surgen
como el resultado de memorizar la información y no por el hecho de
entender los conceptos.
• Los maestros ya no utilizan tácticas utilizan para inspirar a los
estudiantes a que se comprometan con el aprendizaje. Y se preocupan
más por perder su trabajo que por los resultados que se obtienen en
las pruebas y lo peor, por proveer un aprendizaje auténtico a sus
estudiantes.
• Lo anterior ha causado que los docentes no atiendan el desarrollo
social y moral de sus estudiantes.
• En las escuelas de bajos recursos los estudiantes deben brindarle
mayor importancia a la adquisición de mejores punteos y menor
importancia a un aprendizaje significativo.
• Por otro lado es preocupante que en la administración de estos
exámenes los resultados positivos en las pruebas solamente sean
consecuencia de desarrollar buenas habilidades para tomar exámenes.
Además es importante reconocer que el tiempo que se utiliza para
preparar a los estudiantes para las pruebas es tiempo que se podría
usar para enseñarles a pensar de forma crítica, creativa y convertirse
en pensadores curiosos.

c. ¿Con quien está de acuerdo? ¿Por qué? Si tiene acuerdo parcial con
algunos de los argumentos, indíquelo. Sustente su postura.

Considero que ambas posturas presentan argumentos a favor y en contra de


las pruebas de alto impacto, sin embargo, Kohn tiene razón al argumentar
que las instituciones se preocupan por llevar a cabo una excelente prueba
dejando a un lado todos los valores y enseñanzas “útiles” en la vida, pero todo
esto no sería problema, sí se tomara en cuenta la postura de Popham al decir
que las pruebas no están bien elaboradas y que perjudican a los estudiantes a
los docentes y a las escuelas en general. Por lo que considero que es preciso
mejorar el Sistema de Evaluación dentro de las instituciones y fuera de ellas
para poder realmente medir el aprendizaje de los estudiantes en un país,
cuestión que no es mala si se advierte que una buena prueba puede brindar
un panorama claro de la calidad educativa del país, además mejorar la calidad
docente, preocupados por un proceso de enseñanza aprendizaje efectivo,
eficiente y eficaz que brinde a todos los estudiantes las destrezas y
habilidades necesarias para la competitividad en el mercado laboral y social.

d. Tanto Popham como Kohn presentan una alternativa a las pruebas de


alto impacto. Presente y discuta ambas alternativas.

Popham Kohn
Se enfocan en un número limitado de Elaborar portafolios para evaluar el
estándares y contenidos más desempeño de los estudiantes. En él
importantes. que los estudiantes recopilan lo que
han hecho y el progreso que han tenido
Incorpora las destrezas y las sub en su aprendizaje. Con ello los padres
destrezas. pueden ver personalmente el
desempeño de sus hijos.
Incluye una descripción de la Recibir un informe del profesor, basado
evaluación clara y se revisa la calidad en la evaluación y el análisis de
de la prueba por un grupo de ejemplos que permitan mostrar el
educadores para que tenga un efecto aprendizaje de los estudiantes,
positivo en la educación. utilizando básicamente dos sistemas
para proveer información el record de
El tipo correcto de los test de alto aprendizaje y ejercicios realizados.
impacto puede medir y realzar la
calidad de la educación de nuestros Además se pueden llevar a cabo las
niños. siguientes acciones:

“Ninguna escuela puede tener idea del Preparar a los estudiantes para las
progreso de sus alumnos sin usar pruebas, pero se debe regresar al
pruebas estandarizadas” verdadero aprendizaje.

“Dichas pruebas son el único medio de Hacer la preparación para las pruebas
medir la habilidad y el progreso de de manera creativa, libre de tensión y
alumnos” estrés tanto para el docente como para
el alumno.
“Benefician a maestros interesados en
obtener los mejores resultados de cada Los docentes deben involucrarse en los
niño” eventos relacionados a la toma de
decisiones que tienen que ver con
“Crean entusiasmo entre los políticas de educación.
estudiantes”
Se debe concientizar a los padres de
familia de que las pruebas no reflejan la
realidad del proceso de aprendizaje.

Preparar a los docentes sobre como


pasar pruebas, para ellos se debe
hablar con agencias que brindan
servicios educativos, universidades que
ofrezcan información de cómo pasar las
pruebas.

Además se considera como una


alternativa para que las pruebas de alto
impacto puede realizarse son:

No tener limite de tiempo en las


pruebas.
No debe aplicarse a niños pequeños.
No deben pasarse con frecuencia.
No deben tener referencia a normas, o
reportar de esa manera haciendo
énfasis en comparar.
No deben consistir en pruebas de
selección múltiple,
Deben estar diseñadas para que los
estudiantes entiendan las ideas más
que muestren su habilidad para
memorizar listas de hechos y
definiciones.

Es importante destacar que son dos posturas totalmente antagónicas, los que es
importante es que pueden utilizarse ambas estrategias para evaluar a los
estudiantes y/o maestros, la unimodalidad en evaluación es una panorama muy
escaso, por lo que se pueden alternar ambas forma durante el proceso de
enseñanza aprendizaje de un estudiante, sin embargo, es preciso hacer notar que
una modalidad presentada como la de Kohn no permite brindar los resultados a
nivel nacional, por lo que las pruebas de impacto de Popham son una mejor
estrategia, no sólo por el costo sino también por el tiempo.
3. Contraponga la postura de Kohn con la presentada por los artículos
leídos en Phelps.

a. Identifique los argumentos presentados en los artículos de Phelps,


resúmalos brevemente y contrapóngalos a cada argumento esgrimido
por Kohn:

Kohn: Indica que las pruebas de alto impacto tienen sus errores y todo comienza
porque las personas que están de acuerdo con las mismas no son los maestros
que son lo que están en las aulas sino los altos funcionarios de gobierno lo que
deciden tenerlas. ¿Qué pasa cuando los maestros y estudiantes indican que
prefieren seguir aprendiendo sin importar las notas, no es esto una señal para
cambiar las cosas y reevaluar los tests? Sin embargo, la respuesta es el forzar a
preocuparse por los resultados. Lo que resulta es muchas veces una vergüenza
pública para los alumnos y/o maestros. Hemos llegado al colmo de premiar al que
saca buenos resultados y sobre todo de castigar al que no los saca, no solo
avergonzándolo. Muchas de las pruebas estandarizadas tienen un amplio margen
de error y muchas de las decisiones se toman dentro de éste margen de error. Por
otro lado las pruebas estandarizadas también tienen límites que perjudican a los
jóvenes. Lo que produce este sistema de premio o castigo es resentimiento y odio
hacia el mismo por otro lado no hay muchos antecedentes que este sistema
funcione por lo que se podría decir que nuestros niños y jóvenes están sirviendo
de experimento para ver si esto realmente funciona, ¿hasta dónde? Por otro lado
se ha comprobado que los maestros que se preocupan mucho por las notas son lo
que tienen alumnos con notas bajas, en muchos de los casos. Como
consecuencias tenemos:
• Sacar a los buenos maestros y directores de sus profesiones.
• Si se quedan se vuelven a la defensiva y muy competitivos.
• Se provoca que muchos hagan trampa.
• Se puede poner a los maestros en contra de los alumnos.
• Provoca sobre especializaciones, en áreas específicas y no holísticas.
• La conversación sobre educación se limita.
Lo que provoca una cultura de “Enseñar para la prueba no para el alumno”, de
la cuál se destacan consecuencias enormes que van en contra de los principios
básicos de la educación. Todo esto provoca una presión extra tanto a los
maestros, centros educativos y a los estudiantes lo cuál los aleja del aprendizaje
real significativo y los envuelve en el hecho de ganar una prueba.

Los maestros por estar pendientes de las pruebas dejan a un lado muchos
aspectos reales de aprendizaje dentro del aula por cubrir contenidos para la
prueba y lo peor de todo es que al utilizar ejemplos se limitan a los que pueden
poner en el examen. Se cae en errores como dar a los alumnos las respuestas o
aún peor, catalogar como capaces o no, por el resultado de las pruebas. Lo cuál
nos lleva a que una nota alta no siempre es sinónimo de aprendizaje alto y
viceversa. Por lo mismo las pruebas caen en perjudicar a alumnos por su calidad
social y económica, muchas preguntas envuelven la suposición de un contexto
para el alumno en cuál no todos tienen. Si se premia con dinero a un buen
maestro ¿cómo lo hará una escuela sin mucho fondos por ser de clase pobre? Lo
que indica que estas escuelas podrían no tener a los mejores maestros en el área.

Por todo esto no son necesarias las pruebas más que para comparar escuelas o
estados, la manera correcta sería en tener una mayor relación con los maestros y
los padres para hablar sobre el desarrollo de su hijo por medio de la observación,
ensayos, trabajos individuales, grupales etc. De este modo lo mismos padres se
darán cuenta del aprendizaje de sus hijos por medio de la propia observación de
su trabajo. Se requiere para lograr esto un rol integral por parte del maestro en el
aprendizaje del alumno.

i. Pruebas de alto impacto contexto, características, críticas y consecuencias


(Cizek)
Las pruebas estandarizadas son un logro y una ayuda inmedible para los
maestros y sus resultados como educadores logrando medir el aprendizaje de los
alumnos y confirmar que aprenden. Las pruebas no solo ayudan a los maestros
sino también los alumnos tienen buena percepción sobre ellas confirmando que es
de suma ayuda par su aprendizaje. En los últimos 80 años se han oído críticas a
las pruebas que indican: frustración en maestros, niños pequeños llorando o
vomitando, deserción, reducción de tiempo para instrucción, educación
militarizada, currículo estrecho, inequidades sociales, trampa y blasfemias. Sin
embargo estas críticas tienen sus errores. Las pruebas de alto impacto para
empezar son las que SI tienen una consecuencia de acuerdo a los resultados,
esta consecuencia puede ser para el alumno por ejemplo la promoción; y también
puede ser para el maestro con un aumento de sueldo o bonos y también para el
colegio o institución catalogándola por su calidad. Se debe observar la utilidad
pero también se deben visualizar los problemas que puedan traer las pruebas, por
ejemplo una prueba oral debe ser adecuada y se debe conocer al evaluando pues
no sería justo si tiene problemas de pronunciación o de algún tipo en la vía oral,
con este ejemplo nos damos cuenta que no se puede generalizar ningún sistema.
Así como se puede dar un diploma por aprobar las pruebas, las mismas también
provocan muchos síntomas en los niños que son consecuentes de la presión que
la misma causa y los cuales no son sanos ni adecuados para un buen sistema de
aprendizaje, podría ser la parte de atrás de las pruebas. Con estos datos muchas
críticas concluyen que las pruebas son graves para la educación en el mundo post
moderno. Aunque hay muchos autores en contra como por ejemplo Kohn que era
claro al citar que los maestros deberían luchar en contra del monstruo de las
pruebas estandarizadas, existen reportes como el de Business Roundtable (2001)
que los reportes en contra de las pruebas estandarizadas han sido exagerados y
también se ha sabido que de 1,023 padres de familia el 83% ha indicado que las
pruebas son un método que los ha ayudado a observar el desarrollo de sus hijos
y 9 de cada 10 quisiera poder ver estudios comparativos de sus hijos y las
escuelas a las que atienden. Dos terceras partes de los padres indicaron que
desearían recibir esos resultados en cada grado, algunos 3 veces al año y otros
solo una. Por otro lado las pruebas estandarizadas ayudan no solo al
desenvolvimiento y rendimiento de los maestros, sino a confirmar el aprendizaje
de los alumnos y sobre todo a catalogar el rendimiento de las instituciones
educativas.
ii. Beneficios de las pruebas (Phelps)

A continuación se presentan 10 consecuencias positivas de las pruebas de alto


impacto:
1. Desarrollo profesional.
2. Plazas para mejorar la educación a alumnos con necesidades especiales.
3. Conocimiento sobre evaluar
4.5Colección y uso de la información.
2. Opciones educativas
3. Sistemas más confiables
4. Mejor entendimiento de los maestro con su disciplina.
5. Pruebas con calidad.
6. Aumento en el aprendizaje de los alumnos.

iii. Concepciones erróneas acerca evaluaciones masivas (Goodman y


Hambleton)
Con el (NCLB) Ningún alumnos se queda atrás, las instituciones educativas deben
buscar la manera de mejorar su calidad y su rendimiento, especialmente en
lectura y matemática. Por lo mismo, muchos estados han tenido que buscar las
herramientas para mejorar la calidad y el rendimiento de sus instituciones. Muchas
de las concepciones son las mismas al criticar las pruebas de alto impacto, por
ejemplo estas pruebas exponen a los estudiantes al fracaso y mucho dinero se
invierte y muchos ítems no ayudan a una minoría de la población, por sus
consecuencias socioeconómicas y también sus expectativas son muy altas lo que
provoca fracaso en muchos estudiantes. Luego de analizar la situación se observó
que estas críticas provenían de mal entendimientos sobre la conceptualización,
diseño, implementación y evaluación de las pruebas de alto impacto.

Cómo respuesta a estas críticas se exponen los siguientes puntos:

• Pruebas de alto impacto hechas para el fracaso de estudiantes,


maestros y escuelas:
Se critica que una sola prueba no puede medir todo el año y mucho menos
indicar si habrá promoción del mismo, por otro lado no mide lo importante
en los grados de Kinder a 12 vo. Es lógico que no se puede medir todas las
áreas del currículo en esta prueba pero si las consideradas más
importantes. Para cumplir con la ley y luego que mas de 42 estados en un
año hallan utilizado este método se puede decir que sí se está evaluando lo
que se tiene que aprender, los estados se deben apegar a los estándares y
trabajar para ellos. Por ultimo en los estados se da a notar que las pruebas
de alto impacto dan el resultado para el que fueron elaboradas.

• Las pruebas son muy costosas:


Los críticos alegan que no solo se invierte mucho tiempo por parte de los
alumnos y maestro sino también mucho dinero sin embargo los estudios de
la última década nos indican que no se invirtió tanto dinero como ellos
indicaron. Sin embargo la GAO indica que no hay una sobre evaluación en
los estudiantes, concluyendo que los estudiantes pasan menos de 7 horas al
año en actividades relacionadas con los tests estandarizados y no lo que los
críticos indican. Por otro lado el tiempo de los maestros es de menos de 6
horas al año, 40% fue para la administración de las pruebas y menos del
30% para la preparación de los estudiantes para las mismas. La GAO
también indica que los costos no son elevados pues es de aproximadamente
$15 por alumno. Se alega que se debe invertir más pero no se he observado
que la ley ha indicado que se hagan 17 evaluaciones para el sistema de
NCLB en la actualidad.

• Las pruebas de alto impacto están llenas de ítems tendenciosos:


Los críticos alegan que existen ítems que van en contra o que perjudican a
culturas diferentes que viven en USA por ejemplo los negros y los hispanos.
Es cierto que en los resultados de ACT y SAT los negros e hispanos han
salido por debajo de la media. Para explicar esto se debe mencionar la
definición de ITEM BIAS que indica que 2 personas con el mismo nivel de
competencias pero con diferentes grupos de intereses tendrán diversos
resultados. Para trabajar en esto se mencionan 6 pasos que se toman
rutinariamente por las agencias de los estados de USA para no caer en las
BIAS:
o Se toma en cuenta a personas de las diversas clases socio culturales
para la creación de los materiales.
o Comités de sensibilización de ítems indican que se debe enfocar en
pruebas educacionales y en aspecto que puedan ser un poco injusto
para una pequeña minoría.
o Los revisores de ítems deben revisar e indicar si existen ciertas
injusticias hacia grupos minoritarios.
o Se ha sacado información que pudiera sesgar a estos grupos.
o Todos los tests y los departamentos de los estados encargados de
hacerlos, tienen un documento que indica los pasos para no caer en
sesgar.
o Al final de la prueba hay comités que evalúan que no haya aspectos que
perjudiquen a estos grupos minoritarios.

• Las funciones de los estándares están muy por encima de lo esperado.


Los críticos no saben que muchos estudiantes están por debajo de los
estándares y también que no muchos están por encima de los mismos. Creen
que los estándares se sacan del aire mientras que la realidad es que se
absorbe información de manuales técnicos para la realización de los mismos.
En la actualidad existen 3 métodos que muestran eficiencia en este caso sin
embargo no sólo se deben juzgar por los resultados sino también se validan por
los siguientes puntos:

o Las personas que hacen las representaciones de los estándares deben


estar muy bien calificadas.
o Los datos e información debe ser clara.
o La sensatez del proceso en que los panelistas usan para las funciones de
los estándares.
o La relación de confidencialidad que los panelistas tienen durante el proceso.
o La recopilación de información valedera para respaldar las funciones de los
estándares.

Este es uno de los procesos más difíciles por esto es que lleva tantos pasos y
supervisión.

• Fabricantes, educadores y miembros en general del entendimiento de


los resultados públicos:
Es muy importante entregar los resultados cuantitativos de las pruebas porque
éstos indican lo que se ha podido hacer y sobre todo lo que hace falta por
hacer. Todos los envueltos deben poder tener acceso a esta información. Al
interpretar los resultados los críticos se basan en errores no de las pruebas
sino de las personas involucradas al pensar que”estadísticamente significa
diferencias, grandes diferencias”.

iv. Preguntas más frecuentes sin preguntar (Sireci)


Muchas personas critican los tests a otras no les gusta tomarlos, pues causa una
tensión enorme, esto incide a no estar de acuerdo con tomar pruebas. Este autor
considera que las pruebas adecuadas, bajo las medidas y factores adecuados
ayudan a que las personas tengan un mejor rendimiento educativo y mantenerlas
más cerca de sus propias metas. Muchas personas no solo creen que las pruebas
no miden lo que deberían sino que también perjudican a la población minoritaria.
Sin embargo me he dado cuenta que buenas pruebas se usan para las ocasiones
incorrectas, o sea “no es la prueba la mala sino el uso que se le da”. Para
entender mejor las cosas se plantean preguntas que se deberían de saber por
todos para observar la importancia de las pruebas en la sociedad:

¿Qué es una prueba estandarizada? Las personas culpan a las pruebas


estandarizadas de ser injustas y discriminatorias. Estandarizada significa que el
contenido de la prueba es equivalente al contenido y que las condiciones del que
toma la prueba es la adecuada y la misma. Lo más importante es que se aplica
bajo las mismas condiciones y bajo las mismas reglas, preguntando lo mismo a
todos, y se creó de manera uniforme.
¿Cómo son las notas para ganar incluidas en las pruebas? Para hacerlo se
debe pensar siempre en minimizar las posibilidades de que alguien que sabe
pierda y que alguien que no sabe, gane. Se dice que se debe saber el 70% del
contenido (reflejado en la prueba) para poder aprobar, sin embargo se debe de
observar el contexto de la prueba, pues pueden haber notas de 80 que no saben
ni la mitad de una nota de 50, entonces se debe de tratar de ser justos, enseñar
de manera igualitaria con las mismas oportunidades en todos y procurar los
mismos aprendizajes.

a. Argumentos en pro y en contra


Para obtener un método de evaluación que proporciona una mejor calidad
educativa en el país deben tomarse en cuenta las características propias del
país, por ejemplo:
• La capacidad del magisterio.
• Baja inversión económica.
• Mantenimiento e infraestructura de las instituciones.
• Apoyo a las políticas educativas.

Es importante que las pruebas en sí mismas no sean los ejes de cambio, son
las herramientas para proponer soluciones y argumentar el cambio. La
modalidades de evaluación pueden ser utilizadas para brindar al estudiante la
oportunidad de demostrar sus habilidades y destrezas. Sin embargo, el costo a
nivel nacional de realizar una prueba como la propuesta por Kohn no brinda la
posibilidad de evaluar a toda una población por lo que realizar una prueba de
alto impacto debe ser realizada de tal manera que el costo sea bajo, así como
el tiempo que tome al estudiante resolverla.

b. ¿cuál de los argumentos le parece más coherente. ¿Por qué?

La inversión en la elaboración de las pruebas, es importante destacar que en un


país como Guatemala el costo económico es vital, tanto para mejorar la calidad
educativa como para preservarla.
Las pruebas de alto impacto son tiene una doble implicación, mejorar la calidad y
crear presión para que se mejore. Mientras no se determine una prueba de está
magnitud en el país, todas serán pruebas diagnóstico para demostrar que no se
ha logrado nada aún.

4. En Guatemala la evaluación de de aprendizajes es incipiente. Hay


evaluaciones de bajo riesgo (primaria y secundaria) y de alto riesgo
(maestros). A la luz de lo leído:

a. Está de acuerdo con estas evaluaciones en Guatemala (ambas, alto y


bajo riesgo). ¿Por qué en cada caso?
Con las evaluaciones de impacto podemos beneficiar el proceso de
enseñanza aprendizaje, a los alumnos y a las instituciones educativas. Por
lo que considero que deben existir y cada vez mejorar la implicaciones de las
mismas, es decir, si una institución no está teniendo un buen rendimiento
puede ser que sus estudiantes no estén acostumbrados a ser evaluados de
esa forma por lo que una prueba de bajo riesgo puede ser aplicada al inicio
hasta llevarla a las consecuencias de una prueba de alto riesgo.

Así mismo, el cuerpo docente debe ser sometido frecuentemente a este tipo
de pruebas para mantener su actualización y mejorar la calidad.

b. ¿Qué recomendaría Ud. para evitar o reducir los peligros apuntados por
Popham y Kohn?

• Presiones malinterpretadas en educadores le recomendaría: Demostrar que


la teoría puede ser llevada a la práctica por lo su experiencia debe ser
comprobada en su campo laboral.

• Malas identificaciones de escuelas superiores e inferiores le recomendaría:


Modificar sus procesos de enseñanza, metodología, evaluación, etc. Para
mejorar su calidad. Motivar a su personal docente para que mejoren el
proceso de enseñanza aprendizaje.

• Reducción del Curriculum le recomendaría: Si las bases de los


conocimientos son fuertes cualquier aprendizaje posterior se facilita, por lo
que no se trata de repetir lo mismo todos los años sino mejorar las
estrategias para que el aprendizaje sea significativo.

• Test presionan a la Trampa: Si los docentes y la institución son de calidad,


los estudiantes así mismo lo son. Por lo que la trampa no es un factor que
determine a largo plazo la calidad del plantel o del estudiante. Mejorar las
estrategias de evaluación puede hacer caer a los mediocres.

• Cuando a los docentes y a los estudiantes los resultados ya les son


indiferentes:
Alumnos: que la evaluación sea de impacto incidiendo en su nota de
promoción.

Maestros: que los resultados de sus estudiantes incidan en una forma


de promoción salarial.

• Publicar resultados positivos y negativos, solicitando a los padres de familia y


a los alumnos que aporten comentarios o sugerencias constructivas a
solucionar los aspectos en los cuales se dio mayor dificultad.

c. El círculo de empresarios de la educación se ha opuesto a estas pruebas,


aduciendo que son injustas para los colegios que tienen estudiantes con
menos recursos económicos. ¿Por qué este argumento es falaz? ¿Cómo
debe hacerse el análisis de los datos para rebatirlo? Pista: examine el
concepto de ranking y el concepto de valor agregado
El argumento no es valido, lo que miden son los contenidos, ellos argumentan
que castigan con mayor severidad a los estudiantes con escasos recursos
económicos, por no contar con la tecnología y con docentes a diario, pero si bien
la oportunidad de aprendizaje es negada en algunas instituciones las pruebas
evalúan “el mínimo” los estándares que todo estudiante debe saber, no los
máximos o destrezas ajenas a la currículo nacional.

El análisis de datos debe hacerse por medio de encuestas a docentes y alumnos,


aplicación de pruebas de piloto para hacer las comparaciones entre medias y
datos estadísticos, con el objetivo de verificar que los contenidos del CNB están
siendo impartidos en las instituciones públicas y privadas, ya que en base a ellos
se están elaborado las pruebas.

Para evaluarlos adecuadamente es importante difundir los estándares que


permitan marcar los aprendizajes “mínimos” que cualquier estudiante debe saber,
por lo que la evaluación sería válida. La comparación sería de acuerdo a este nivel
de conveniencia.

Si una institución no cumple con los estándares de funcionamiento debe ser


cerrada, pues considero que en cuestión de educación no debe haber medios sino
que tiene que ser buena. Pareciera un argumento extremo pero no puede mal
formarse a un niño o una niña, presionar a las comunidades para que exijan
calidad y que no se conformen con docentes que a veces llega y a veces no
simplemente porque no quieren, defender sus derechos como usuarios de un
servicio así mismo involucrarse en el aprendizaje de sus hijos para que no sea la
escuela la única formadora.

El análisis de datos debe hacerse de acuerdo a los contenidos no alcanzados y


determinar los puntos a mejora el siguiente año.
5. ¿Cuáles son las implicaciones de la propuesta de Popham para la
enseñanza y la evaluación en el aula? ¿Qué implicaciones tiene para la
formación de maestros o para la capacitación en servicio. Discútalo en
detalle. Sea cuidadoso en apoyarse en la literatura al discutirlo.

La prueba puede ayudar al docente a dar una buena enseñanza. Pero es


necesario considerar si la prueba que se realizar ayuda o entorpece la calidad
educativa. Actualmente las pruebas son malas y producen malos efectos debido a
la consideración de que si se tienen altos resultados la educación es mejor,
además desvían la atención del maestro de las decisiones educativas importantes.

Se debe prestar especial atención al leer los resultados; las escuelas con
resultados bajos pueden presentar cambios más altos que escuelas con
resultados altos, además, las escuelas con resultados bajos reciben más apoyo
(más personal, supervisión o fondos) y son “etiquetadas” (malas, bajas, débiles)
esto afecta la moral y autoestima de catedráticos y alumnos.
Muchas de las cosas que son evaluadas no son enseñadas en la escuela sino en
el hogar. Esto implica muchas veces buenos resultados, pero no necesariamente
un “mejor” docente o “mejor” escuela.

Buenos maestros en escuelas con problema son obligados a cambiar su


metodología causa del rendimiento de los estudiantes, y malos maestros en
escuelas con buenos resultados permanecen y son incentivados.

La atención curricular está centranda en aspectos de la evaluación únicamente


enseñando lo que se va a evaluar y dejando a un lado lo que no. Por lo que los
estudiantes pierden el interés debido a tanta repetición, como si repetir una y otra
vez aumentaría la calificación en una prueba, si además de ello ni siquiera es una
repetición dirigida.

Algunos de los mayores problemas al realizar las pruebas es que los docentes
dirigen al alumno hacia la respuesta correcta, otorgan más tiempo para que
puedan terminarlas, revisan y devuelven la prueba al estudiante para que revise
sus errores esto conlleva a que los resultados en las pruebas sean mejores pero
su nivel de conocimientos no.

En clase una prueba se utiliza para brindar información y decidir sobre como
proceder sobre el nivel de conocimiento de un alumno, las pruebas de clase son
una muestra del total de conocimientos impartidos. No es posible medir todos los
conocimientos. La prueba no es válida o invalida, son las inferencias
(calificaciones) que se hacen del alumno.

You might also like