You are on page 1of 8

Dos Dimensiones de Pruebas

Psicomtrica y Edumtrica
Ronald Carver, Instituto Americano de Investigacin (American Institute for Research)
Traducido por: Nal Sanz

Un desarrollo reciente en la aplicacin de punto, reflejan las diferencias entre individuos


pruebas implica el diseo y la construccin de y el crecimiento de un individuo. Cada uno de
pruebas referidas a criterios. Las pruebas estos enfoques pueden considerarse como
referidas a criterios estn diseadas para una dimensin separada de todas las
arrojar medidas que son directamente pruebas. Sin embargo, debido a su diseo y
interpretables en trminos de estndares de desarrollo, la mayora de las pruebas harn un
desempeo especficos [Glacer & Nitko, 1971, mejor trabajo en un rea que en el otro.
p.653]. Las pruebas desarrolladas
tradicionalmente, es decir, aquellas diseadas Las pruebas que se han concentrado
para medir a una persona en relacin a un en la medicin de las diferencias entre
grupo normativo, han sido denominadas individuos han sido denominadas pruebas
pruebas referidas a normas (ver Popham, psicomtricas. Por lo tanto, esta dimensin de
1971). La distincin entre la nueva prueba las pruebas se denominar la dimensin
referida a criterios y la tradicional prueba psicomtrica. Una prueba puede evaluarse en
referida a normas es importante. Sin embargo, trminos de sus propiedades psicomtricas, es
la distincin tambin es engaosa. Sugiere decir, el grado hasta donde reflejen las
que una prueba recientemente elaborada debe diferencias estables entre los individuos que
ser o referida a normas o a criterios de forma tradicionalmente han sido de inters principal
mutuamente exclusiva. Esto es engaoso en la aplicacin de pruebas psicolgicas. La
debido a que una prueba referida a criterios otra dimensin de las pruebas se denominar
puede estar referida a un grupo normativo y la dimensin edumtrica (Ver Carver, 1972,
una prueba referida a normas a unos criterios. 1973). Una prueba puede evaluarse en
trminos del grado hasta donde reflejen el
No slo hay un problema semntico crecimiento de un mismo individuo que
subyacente en el nuevo movimiento de tradicionalmente ha sido de inters principal
aplicacin de pruebas, sino que hay un en la aplicacin de pruebas educativas. Por
problema real tambin. El problema gira en ejemplo, las pruebas diseadas por
torno a la medicin de diferencias individuales profesores, usualmente se concentran ms en
versus la medicin del monto (cantidad) la dimensin edumtrica en lugar de la
aprendida. Cronbach (1971) seal que en dimensin psicomtrica.
psicologa, el movimiento de aplicacin de
pruebas se inici con el nfasis Darwiniano en La incapacidad de mantener las dimensiones,
las diferencias entre los individuos. As, todo el psicomtrica y edumtrica, conceptualmente
trabajo terico detrs de las puntuaciones de separadas ha resultado en una cierta
las pruebas ha intentado conceptualizar las confusin al momento de evaluar las pruebas.
diferencias en habilidades o rasgos. [p.446]. Por ejemplo, los Estndares para las
McClelland (1973) argument, muy Pruebas y Manuales Educativos y
adecuadamente, que los colegios deberan de Psicolgicos de la Asociacin Americana
aplicar pruebas que midan competencia en de Psicologa (1966) [Standards for
lugar de habilidad (capacidad). En otras Educational and Psychological Tests and
palabras, los colegios deben de utilizar Manuals] sealan que los informes de los
pruebas referidas a criterios, en lugar de estudios de confiabilidad normalmente deben
pruebas referidas a normas. No obstante, de estar expresados en el manual de prueba
Parece que McClelland generaliz ms all de en trminos de varianzas de componentes de
los colegios cuando afirm que las pruebas error (o sus races cuadradas) o errores tpicos
deben estar diseadas para reflejar los de medicin o coeficientes de confiabilidad
cambios en lo que el individuo ha aprendido momento-producto [p. 29]. Este enfoque
[p.8]. No todas las pruebas deben estar sobre las varianzas y los coeficientes de
diseadas para maximizar la susceptibilidad al correlacin es de suma importancia para las
crecimiento en experiencia o conocimiento. propiedades psicomtricas de una prueba,
Algunas pruebas deben medir las diferencias pero carece de tal para las propiedades de
individuales en cuanto a la aptitud para el una prueba edumtrica. Una prueba puede ser
crecimiento. perfectamente confiable desde una
perspectiva edumtrica y al mismo tiempo
El empuje del presente artculo es que hay perfectamente no confiable desde una
espacio para ambas pruebas, aquellas que se perspectiva psicomtrica. Los estndares no
enfocan en diferencias estables entre los hacen este tipo de discriminacin; pero,
individuos y aquellas que miden los aumentos reflejan una tendencia de evaluar todas las
(ganancias) progresivos de un mismo pruebas desde un punto de vista psicomtrico.
individuo. Todas las pruebas, hasta cierto Hay poco reconocimiento sobre el hecho que

Julio 1974 American Psychologyst 1


Dos Dimensiones de Pruebas
Psicomtrica y Edumtrica
Ronald Carver, Instituto Americano de Investigacin (American Institute for Research)
Traducido por: Nal Sanz

es muy posible que una prueba sea (es decir, p= .50). tems que todos los
extremadamente buena desde una estudiantes responden correctamente son
perspectiva edumtrica y extremadamente descartados o revisados. La eficiencia
mala desde una perspectiva psicomtrica. psicomtrica de la prueba se maximiza cuando
p=.50 porque en ese punto las varianza de las
El resto del artculo est relacionado puntuaciones de la prueba es mayor.
con cmo evaluar una prueba desde ambas Pequeas varianzas automticamente
dimensiones, la edumtrica y psicomtrica. disminuyen las estimaciones de confiabilidad y
validez psicomtrica. Otra manera de de
seleccionar buenos tems desde una
Propsito perspectiva psicomtrica es al utilizar
correlaciones tipo tem-prueba. Al
correlacionar las puntuaciones en cada tem
PSICOMTRICO de una prueba, con la puntuacin total de la
prueba, los tems con las correlaciones ms
Si el propsito de una prueba es medir las altas son seleccionados puesto que son los
diferencias individuales, por ejemplo, una mejores al discriminar entre los individuos.
aptitud general, habilidad o rasgo, entonces la Aquellos tems que todos tienden a acertar o
prueba debe ser evaluada utilizando fallar automticamente tienen correlaciones
principios psicomtricos. Sin embargo, la tem-prueba bajas y por lo tanto sern
prueba puede ser evaluada desde una descartadas.
perspectiva edumtrica tambin.
EDUMTRICO
EDUMTRICO El tem ms eficiente desde una perspectiva
edumtrica es aquel que es mximamente
susceptible al crecimiento o la ganancia
Cuando el propsito principal de una prueba (aumento). El mejor tem edumtrico es aquel
es medir el aumento o crecimiento de los que muestra el mayor incremento en la
individuos, por ejemplo, la medicin de proporcin que pasa de una condicin de
conocimiento, habilidad, desempeo, la tratamiento pre a una post. Una manera de
prueba debe evaluarse utilizando principios seleccionar los mejores tems de tipo
edumtricos. edumtrico es al administrarlos en un arreglo
en donde los tems deben reflejar cambio o
crecimiento. Los mejores tems edumtricos
EJEMPLO tienen valores p que se acercan a .00 previo a
la condicin de tratamiento y valores p que se
El propsito principal de la prueba de aptitud acercan a 1.00 despus de la condicin de
matemtica puede reflejar diferencias estables tratamiento
entre individuos que son tiles para predecir el
desempeo en una variedad de tareas
matemticas. El propsito de este tipo de EJEMPLO
tarea puede ser, por ejemplo, predecir la
duracin de tiempo requerida para que un La prueba de aptitud matemtica, mencionada
estudiante de octavo grado aprenda a calcular anteriormente, puede desarrollarse
la raz cuadrada de cualquier nmero. El administrando una serie de tems a un grupo
propsito principal de esta prueba sera de estudiantes de octavo grado y eliminando
psicomtrico. No obstante, si una prueba se aquellos tems que casi todos los estudiantes
desarrolla para determinar si un individuo contestan correctamente o incorrectamente.
aprendi a calcular la raz cuadrada, entonces La prueba de la raz cuadrada puede
el propsito de la prueba sera edumtrico. desarrollarse al administrar un conjunto de
tems a un grupo de estudiantes que nunca
recibieron instruccin sobre raz cuadrada y a
otro grupo de estudiantes que s recibieron tal
Seleccin de tems instruccin. Aquellos tems que mostraron
poca ganancia (aumento) seran descartados.
PSICOMTRICO

El tem ms eficiente desde una perspectiva


psicomtrica es aquella que tiene una
proporcin final (proporcin de aciertos) de .50

Julio 1974 American Psychologyst 2


Dos Dimensiones de Pruebas
Psicomtrica y Edumtrica
Ronald Carver, Instituto Americano de Investigacin (American Institute for Research)
Traducido por: Nal Sanz

Validez Confiabilidad
PSICOMTRICA PSICOMTRICA

Para evaluar empricamente la validez Conceptualmente, la confiabilidad es un


psicomtrica de una prueba, las diferencias sinnimo de consistencia. La confiabilidad
individuales en la prueba pueden compararse psicomtrica significa que se puede esperar
a las diferencias individuales en otra variable que la prueba discrimine de manera
que est altamente relacionada con la prueba. consistente entre los individuos en una
Si la prueba discrimina entre los individuos en ocasin a otra. La varianza de las puntaciones
aproximadamente la misma manera que la de las pruebas tiene mucho que ver con este
variable de criterio, entonces hay evidencia tipo de consistencia.; es decir, a menor la
positiva para la validez de la prueba. varianza lo ms probable es que las
Generalmente, se puede obtener evidencia discriminaciones cambiarn entre ocasiones.
emprica significativa para la validez de la La confiabilidad psicomtrica se estima
prueba al administrar la misma a un grupo de adecuadamente en relacin a varianzas de
sujetos en un momento determinado. errores, coeficientes de confiabilidad de
producto momento y errores tpicos de
medicin. Todos estos estadsticos dependen
EDUMTRICA de la varianza: si no hay varianza entonces
por definicin no puede haber confiabilidad
Para evaluar empricamente la validez psicomtrica.
edumtrica de una prueba se necesita
evidencia en cuanto a su susceptibilidad a
aumento o crecimiento. Si la prueba refleja Edumtrica
poco aumento o crecimiento en una situacin
en donde se espera un gran aumento o La confiabilidad edumtrica tambin est
crecimiento, entonces existe evidencia en relacionada con la consistencia, pero no con
contra de la validez edumtrica de la prueba. consistencia en la discriminacin de
La validez edumtrica de una prueba individuos. La confiabilidad edumtrica est
usualmente no puede determinarse con la relacionada con el aumento o crecimiento de
administracin de la prueba en un momento los individuos reflejado en la prueba. Una
determinado. Normalmente, la prueba debe buena manera de estimar la confiabilidad de
administrarse en dos situaciones o una prueba edumtrica sera administrar
condiciones en donde el aumento o formas alternas de la prueba en condiciones
crecimiento es de esperarse. El grado real de de tratamiento pre y post. La constancia de
aumento puede ser comparado al grado las puntuaciones de aumento o cambio entre
esperado de aumento para as estimar la las formas proporcionarn una buena
validez edumtrica. estimacin de confiabilidad. Otra manera de
estimar la confiabilidad edumtrica sera
EJEMPLO administrar formas alternas bajo iguales
condiciones de tratamiento y luego determinar
La evidencia emprica con respecto a la el grado en que las puntuaciones individuales
validez psicomtrica de una prueba de aptitud se asemejan en ambas formas. Es importante
matemtica puede obtenerse al administrar la reconocer que la confiabilidad no depende de
prueba a un grupo de individuos cuya aptitud las varianzas en las puntuaciones de pruebas
matemtica haba sido evaluada por su como es el caso de la confiabilidad
instructor en una escala de 7 puntos desde psicomtrica. Quiz este aspecto de la
alta a baja. La correlacin entre las diferencia entre las dimensiones psicomtricas
puntuaciones de las pruebas y las y edumtricas de la evaluacin de pruebas es
evaluaciones individuales reflejaran el grado ms notable. Como se mencion
de validez edumtrica de la prueba. La anteriormente, una prueba puede ser
evidencia emprica con respecto a la validez perfectamente confiable desde una
de la prueba de la raz cuadrada puede perspectiva edumtrica y perfectamente no
obtenerse al administrar la prueba a un grupo confiable desde una perspectiva psicomtrica
de individuos antes y despus de que hayan (Ver Stanley, 1971). Una prueba se considera
recibido instruccin sobre la raz cuadrada. El psicomtricamente confiable si hace las
grado de susceptibilidad al crecimiento de la mismas discriminaciones entre individuos en
prueba en esta situacin refleja la validez dos ocasiones, mientras que una prueba
edumtrica de la prueba. edumtrica es confiable si hace las mismas

Julio 1974 American Psychologyst 3


Dos Dimensiones de Pruebas
Psicomtrica y Edumtrica
Ronald Carver, Instituto Americano de Investigacin (American Institute for Research)
Traducido por: Nal Sanz

discriminaciones del mismo individuo en dos EJEMPLO


ocasiones.
La puntuacin bruta en una prueba de aptitud
EJEMPLO matemtica no se interpretara a menos que
se compare a una puntuacin promedio de un
La prueba de aptitud matemtica sera grupo. Sin embargo, la puntuacin de una
considerada entramadamente no confiable si prueba de raz cuadrada normalmente puede
todos los individuos en una clase obtuvieran la ser interpretada directamente porque
misma puntuacin en la prueba debido a que significara algo con respecto a la tarea de raz
la prueba debe evaluarse principalmente cuadrada. La interpretacin de esta
desde una perspectiva psicomtrica. Sin puntuacin no dependera de la puntuacin
embargo, la prueba de la raz cuadrada puede promedio del grupo.
ser extremadamente confiable si todos los
individuos en una clase obtienen la misma
puntuacin porque la prueba de la raz Evaluacin de Muestra
cuadrada debe evaluarse principalmente
desde una perspectiva edumtrica. En esta Aqu se presenta una evaluacin de muestra
ltima situacin, la prueba de la raz cuadrada para demostrar la utilidad de las dimensiones
sera extremadamente no confiable desde una psicomtricas y edumtricas en la evaluacin
perspectiva psicomtrica. de pruebas. La prueba a evaluarse es la
Prueba de Lectura del STEP, por sus siglas
en Ingls (Pruebas Secuenciales del Progreso
Educativo), publicada en 1957 por el Servicio
Interpretacin de Puntuaciones de Aplicacin de Pruebas Educativas. Esta
prueba fue seleccionada debido a su uso
PSICOMTRICAS generalizado (por ejemplo ver Coleman et al.,
1966) y debido a que es tpico de un gran
Las puntuaciones brutas en una prueba nmero de pruebas que contienen
usualmente no se interpretan debido a que la inconsistencias que seran eliminadas de
puntuacin misma no significa nada a menos utilizarse las dimensiones psicomtricas y
que se compare con una puntuacin promedio edumtricas para evaluar las pruebas.
o por medio de una desviacin de una media o
por percentil de un grupo normativo. As, las
puntuaciones psicomtricas pueden ser PROPSITO
puntajes z, puntajes T, estaninas, percentiles o
cualquier variacin de estos tipos de El propsito establecido de la prueba STEP es
puntuaciones. Las puntuaciones psicomtricas medir la habilidad de comprender enunciados
se desarrollan para proporcionar directos, de interpretar y resumir pasajes y de
comparaciones entre individuos. criticar pasajes con respeto a ideas y
propsitos de presentacin. Este propsito
parece abarcar ms la dimensin edumtrica
EDUMTRICAS que la dimensin psicomtrica. No hay nada
en el propsito que sugiera que la prueba sea
Las puntuaciones brutas en una prueba ms pertinente para reflejar diferencias
pueden interpretarse edumtricamente. La individuales con respecto a estas habilidades
puntuacin edumtrica tiene significado con que para reflejar aumento, crecimiento o
respecto a un criterio, objetivo o escala que es desempeo en estas habilidades. Esta
independiente de las diferencias individuales. interpretacin del propsito principal de la
Las puntuaciones edumtricas tambin prueba est reforzada por el hecho que la
pueden convertirse en puntuaciones prueba es parte de una serie de pruebas de
psicomtricas para proporcionar significado desempeo y la prueba est diseada para
adicional. Por ejemplo, una puntuacin ser utilizada en colegios en donde se
edumtrica puede convertirse en un percentil esperara que la medicin de el aumento o
utilizando una tabla de norma para crecimiento individual en lectura es ms
proporcionar una estimacin del nmero de importante que las diferencias individuales en
personas en un grupo normativo que la aptitud de lectura. Por lo tanto, parece
obtuvieron una puntuacin por debajo de esta razonable esperar que el manual de prueba
puntuacin edumtrica bajo circunstancias se incline ms hacia la dimensin edumtrica
similares. que la dimensin psicomtrica.

Julio 1974 American Psychologyst 4


Dos Dimensiones de Pruebas
Psicomtrica y Edumtrica
Ronald Carver, Instituto Americano de Investigacin (American Institute for Research)
Traducido por: Nal Sanz

psicomtrica. De evaluarse la prueba desde


SELECCIN DE ITEMS una perspectiva edumtrica, ayudara si
hubiese un estimado de la probabilidad en que
No se focaliz sobre la dimensin edumtrica se podra esperar obtener la misma
en el proceso de seleccin de tem. Ms bien, puntuacin por parte del mismo individuo en
se enunci que el objetivo era una prueba con circunstancias similares. Por ejemplo, la
una dificultad de item modal de 0.625 correcta. diferencia promedio de las puntuaciones de la
El valor de .0625 correcta es realmente el Forma A y la Forma B podra darse. Fue
estndar p=.50 cuando una correccin de imposible estimar la confiabilidad edumtrica
elegir al azar es aplicada. Por lo tanto, el en la forma anterior debido a que ambas
nfasis principal de la seleccin de tem formas de pruebas nunca fueron aplicadas a
estuvo en la dimensin psicomtrica en lugar los mismos individuos. La data sugiere que la
de la edumtrica. Si el nfasis hubiese estado prueba es psicomtricamente confiable. Su
en la dimensin edumtrica, entonces el grado de confiabilidad edumtrica no est
procedimiento de seleccin de tem se hubiese determinado.
concentrado en seleccionar aquellos tems
que reflejaran el mayor aumento o
crecimiento. El manual de prueba s seal INTERPRETACIN DE PUNTUACIONES
que la dificultad ideal indicada por la teora
no fue la nica pauta para la seleccin de El manual de prueba enfatiza que las
tems. Una breve descripcin de estas otras puntuaciones brutas nunca se interpretan.
pautas indic que estas eran edumtricas. As Esto sugiere al principio que las puntuaciones
que, probablemente se aplicaron algunos estn orientadas psicomtricamente en lugar
criterios edumtricos, aunque en forma de de edumtricamente. Las puntuaciones brutas
excusa. As, parece que se utilizaron tcnicas primero se traducen en lo que se llaman
de seleccin de tems que tienden a asegurar puntuaciones convertidas. Las puntuaciones
el desarrollo de una prueba psicomtrica de medias convertidas incrementan con cada
confiable y vlida. No obstante, es grado superior entre Grado 4 y 14 y esto
cuestionable que tan buena sera la prueba sugiere que las puntuaciones convertidas
desde una perspectiva edumtrica. pueden tener buenas propiedades
edumtricas. Estas puntuaciones se utilizan
subsecuentemente para determinar bandas de
VALIDEZ percentiles. Si las puntuaciones convertidas se
hubiesen desarrollado para proporcionar
Para el momento en que fue publicada la puntuaciones de tipo edumtrica, entonces la
prueba, no se haba obtenido informacin informacin con respecto a la confiabilidad y
sobre su validez. Se enunci; sin embargo, validez de estas puntuaciones convertidas ha
que el editor esperaba conducir estudios de debido presentarse. El manual para la prueba
validez que relacionaran las puntuaciones de nunca sugiri que una puntuacin puede
la prueba a criterios de medicin adecuados. compararse con otra puntuacin para
Esto sugiere que la validez se estimara la determinar el monto del aumento o
forma psicomtrica tradicional. No hay seal incremento. Por lo tanto, se debe concluir que
que indique que una evaluacin de validez la prueba proporciona puntuaciones que son
tomara en cuenta el grado en que la prueba de uso cuestionable desde un punto de vista
refleje aumento o crecimiento, a pesar de que edumtrico.
el propsito principal parece ser edumtrico.
CRTICA DE LA PRUEBA
CONFIABILIDAD
Desde una perspectiva edumtrica, La Prueba
Slo la confiabilidad de tipo psicomtrica fue de Lectura STEP es de calidad incierta debido
estimada; es decir, se report el uso de los 20 a que ni el proceso de seleccin, ni el proceso
coeficientes de confiabilidad de Kuder de estimacin de confiabilidad, ni la evaluacin
Richardson. El KR-20 es til para estimar la de la validez, ni la interpretacin de las
confiabilidad psicomtrica debido a que se puntuaciones se enfocan en las propiedades
enfoca en las varianzas de tems. Si la edumtricas de la prueba.
varianzas de tems se aproxima a cero, la
confiabilidad psicomtrica de la prueba se Puede parecer extrao que un editor principal
aproxima a cero. El error tpico de medicin de pruebas intente resolver un problema de
fue dado, pero esta estimacin de medicin de tipo edumtrica utilizando una
confiabilidad tambin es de la variedad prueba diseada por principios psicomtricos.

Julio 1974 American Psychologyst 5


Dos Dimensiones de Pruebas
Psicomtrica y Edumtrica
Ronald Carver, Instituto Americano de Investigacin (American Institute for Research)
Traducido por: Nal Sanz

Esto no es sorprendente considerando que vez puedan ser tiles en una prueba
casi todas las pruebas estandarizadas han desarrollada edumtricamente.
sido diseada utilizando principios
psicomtricos sin tener en cuenta/ Al reflexionar, casi no sorprende el hecho que
prescindiendo del propsito enunciado. los psicmetras han tenido tanta dificultad con
Cuando se utilizan principios psicomtricos las puntuaciones de aumento en las pruebas.
para desarrollar una prueba de ejecucin, el Si una prueba ha sido diseada de acuerdo a
resultado usualmente no es una prueba de los mejores principios psicomtricos, sera casi
ejecucin sino una prueba de aptitud (Ver algo coincidencial si las puntuaciones
Anderson, 1972). Las pruebas de reflejasen bien el aumento. Si se desea tener
desempeo/ejecucin seran ms confiables y puntuaciones de pruebas que miden el
vlidas si se desarrollasen con un enfoque en aumento bien, entonces la prueba debera de
sus caractersticas edumtricas. disearse, desarrollarse y evaluarse con un
enfoque en los principios edumtricos. Ms
an, el psicometrista que desee medir y
Discusin estudiar el aumento debe reconocer que es
probable que los estadsticos psicomtricos,
La medicin del aumento o cambio ha sido un tales como varianza y correlaciones, sean
nemesis contnuo para los psiclogos en inadecuados. El uso de principios edumtricos
general y en particular para los psicmetras debe arrojar mayor xito.
(Harris, 1963). Bereiter (1963) manifest que
slo con respecto a los problemas de medicin La distincin entre la dimensin psicomtrica y
del cambio haba escuchado a colegas admitir la dimensin edumtrica siempre ha sido
el haber abandonado objetivos principales de entendida de manera intuitiva por los
investigacin slo porque sus problemas experimentalistas. Por ejemplo, en la
estadsticos parecan insuperables. Ms investigacin de aprendizaje de prosa, el
recientemente, Cronbach y Furby (1970) investigador puede desarrollar 12 preguntas
sugirieron que los investigadores que hacen de seleccin mltiple para determinar cunto
preguntas con respecto a las puntuaciones de se aprendi de un pasaje de lectura corto. La
aumento normalmente deben estar mejor confiabilidad, es decir, la confiabilidad
aconsejados a enmarcar sus preguntas de psicomtrica, de una prueba tan corta sera
otras formas [p.80]. Debido a que el cambio por necesidad extremadamente baja. Sin
es un aspecto de la ciencia que fascina a la embargo, este tipo de confiabilidad ni sera
mayora de los cientficos, es sorprendente considerada por el experimentalista, debido a
encontrar que Cronbach y Furby que l slo est interesado en cun
argumentaban que las puntuaciones de de susceptible es la prueba al cambio o al
aumento rara vez son tiles, no importa cmo aumento que resulta de su tratamiento
sean ajustadas o refinadas [p.68]. Estos experimental. El experimentalista slo est
problemas no con la medicin del cambio o interesado en la validez edumtrica. La razn
aumento siempre involucran modelos principal por la cual el psicmetra ha tenido
correlacionales; es decir, psicomtricos. Por problemas con la medicin del aumento o
ejemplo, Cronbach y Furby definieron la cambio es que el aumento o el cambio
confiabilidad de las puntuaciones de aumento significan que alguna condicin de tratamiento
o de diferencias como la correlacin de las est involucrada y por lo tanto, el psicmetra
puntuaciones con una diferencia observada est entrando en el dominio del
independientemente. [p.70]. Las puntuaciones experimentalista. El psicmetra ha intentado
de aumento en una prueba edumtricas traer consigo sus principios de pruebas
perfectamente confiable que todos reprobaron psicomtricas cuando entr en el dominio del
previo al tratamiento y todos aprobaron experimentalista, pero estos principios son
despus del tratamiento tendra que inherentemente inapropiados.
correlacionar cero con otra variable, por lo
tanto presentando a los aumentos como Muchos psiclogos han fomentado el uso de
perfectamente no confiables en el modelo principios de pruebas psicomtricas en la
psicomtrico de Cronbach y Furby. Parece educacin. Debido a que la educacin
razonable el estar de acuerdo con Cronbach y generalmente implica un efecto de tratamiento,
Furby con respecto al hecho que las es fcil ver cmo la aproximacin edumtrica
puntuaciones de aumento rara vez puedan ser intuitiva del experimentalista sera
tiles en una prueba desarrollada inherentemente ms apropiada para la
psicomtricamente. No obstante, es absurdo educacin que la aproximacin de las
sugerir que las puntuaciones de aumento rara diferencias individuales del psicmetra. El

Julio 1974 American Psychologyst 6


Dos Dimensiones de Pruebas
Psicomtrica y Edumtrica
Ronald Carver, Instituto Americano de Investigacin (American Institute for Research)
Traducido por: Nal Sanz

peligro implicado en utilizar la aproximacin en la aplicacin de pruebas y una multitud de


psicomtrica en la educacin es que las tcnicas y procedimientos estadsticos. La
pruebas desarrolladas psicomtricamente se edumtrica es un poco ms que una idea. Sin
utilizarn para medir los efectos de la embargo, probablemente habr poco progreso
educacin y podra parecer que la educacin en la medicin del aumento, cambio,
es inefectiva debido a que las pruebas no crecimiento o desempeo a menos que los
fueron diseadas o desarrolladas a ser aspectos edumtricos se tomen en cuenta.
susceptibles al crecimiento. Un ejemplo de
este peligro involucra el Informe de Igualdad
de Oportunidad de Educativa (Coleman et al., Conclusin
19966) comisionada por el Congreso. Esta
investigacin utiliz pruebas desarrolladas Cuando se desea una medicin de las
psicomtricamente y anlisis psicomtrico y diferencias individuales, se debe utilizar una
hall que las diferencias entre individuos prueba desarrollada para ser mximamente
contribuyen ms a la varianzas de susceptible a las diferencias individuales. De
puntuaciones que diferencias entre colegios. igual manera, cuando se desea una medicin
Este resultado ha sido interpretado como que del aumento o crecimiento de un individuo, se
tiene implicaciones para la poltica federal con debe utilizar una prueba desarrollada para ser
respecto a la asignacin de fondos de los mximamente susceptible al aumento o
colegios (Mosteller & Moynihan, 1972) debido crecimiento de un individuo. La mayora de las
a que los colegios tienen poco impacto sobre pruebas son susceptibles a ambas, diferencias
el desempeo. Se ha sealado que las individuales y aumento y crecimiento, pero
pruebas psicomtricamente desarrolladas han debido a ciertas tcnicas de diseo y
sido diseadas para producir justo este tipo de desarrollo, usualmente se concentran sobre
resultados, as que el resultado no debe ser una de estas dos caractersticas. Estas dos
sorprendente ni debe utilizarse para influenciar dimensiones de pruebas se han denominado
la poltica federal de asignacin de fondos. psicomtrica y edumtrica.
Las pruebas de desempeo estandarizadas se Una prueba puede evaluarse con respecto a
usan para evaluar programas de tratamiento ambas dimensiones, la psicomtrica y la
innovadores en educacin y muchos de los edumtrica. Debido a que tradicionalmente se
sistemas educativos utilizan estas pruebas ha enfocado sobre la dimensin psicomtrica,
para evaluar profesores y colegios. Estas muchas pruebas estandarizadas se utilizan
pruebas usualmente son psicomtricamente para medir aumento o crecimiento sin haber
estables, pero pueden que no sean altamente sido desarrolladas o evaluadas desde una
susceptibles a las diferencias en el tratamiento perspectiva edumtrica. El peligro de este
educativo; es decir, pueden ser buenas enfoque es que las pruebas desarrolladas
pruebas de aptitud, pero pruebas de psicomtricamente puede que no sean
desempeo pobres. De esta manera, es muy susceptibles al aumento cuando de hecho hay
posible que las diferencias entre una buena aumento.
educacin y una pobre educacin parezca ser
erradamente pequea sencillamente porque Miller (1969) alent a los psiclogos a regalar
las pruebas han sido diseadas para ser ms la psicologa a otras disciplinas. Pareciera que
susceptibles a las diferencias de aptitud que a los psiclogos han estado regalando pruebas
las diferencias de tratamiento. psicomtricas estables a la educacin durante
muchos aos cuando la educacin realmente
El desarrollo creciente de las pruebas ha necesitado pruebas edumtricas estables.
referidas a criterios indica que el enfoque en la La dimensin edumtrica de las pruebas ha
aplicacin de pruebas se est orientando cada sido severamente desatendida por los
vez ms hacia la dimensin edumtrica. No psiclogos implicados en la aplicacin de
obstante, generalmente no se reconoce que pruebas. En la psicologa, los
una prueba referida a criterios pueda tener experimentalistas han sabido intuitivamente
propiedades psicomtricas estables o no que, cuando se mide el monto aprendido, los
estables y que una prueba referida a normas principios psicomtricos no son pertinentes
pueda tener propiedades edumtricas estables (son inaplicables) y los principios edumtricos
o no estables. son necesarios. Se espera que las pruebas
futuras se desarrollen y evalen con una
La psicometra tiene una historia larga apreciacin de ambas dimensiones para que
documentada, una sociedad activa, una ambos investigadores y profesionales tengan
revista profesional una influencia abrumadora

Julio 1974 American Psychologyst 7


Dos Dimensiones de Pruebas
Psicomtrica y Edumtrica
Ronald Carver, Instituto Americano de Investigacin (American Institute for Research)
Traducido por: Nal Sanz

mejores pruebas con las cuales podr resolver


los problemas de medicin.

Julio 1974 American Psychologyst 8

You might also like