Professional Documents
Culture Documents
Lezama 2011
Conceptualizacin
Cuando los asesores, los psiclogos clnicos o los educadores requieren describir
intensa y detalladamente las conductas presentes en el repertorio de una
persona, o identificar sus dficits de cocimientos, o precisar sus competencias en
un rea, debern recurrir a los ya aludidos tests criteriales o tests referidos a un
criterio, los cuales permiten comprar las capacidades o conductas de una persona
con un patrn absoluto que detalla los repertorios conductuales, conocimientos o
destrezas que deberan estar presentes y que son inherentes ese dominio
examinado.
Conceptualizacin
el examinador podra decir que l es capaz de resolver suma, resta y
multiplicacin de fracciones, pero no maneja lo relativo a multiplicacin
de fracciones, que es lo que previamente se haba determinado para
ese puntaje. Con lo anterior, se quiere significar que con la prueba
referida a un criterio permite describir al evaluado en funcin de un
rea dominio particular identificando lo que est en su repertorio y lo
que no.
Conceptualizacin
instrumento que contribuye al diagnstico del Trastorno de Explosivo
Intermitente; y tambin la Prueba de Ideacin Suicida de Bravo de
Cardozo y Garbn (1991), instrumento criterial que informa la
frecuencia e intensidad de los pensamientos suicidas.
Etapa Preparatoria
de 5to Grado.
2. Comunica a los usuarios del instrumento qu es lo que ste mide. As, la PM5
de nuestro ejemplo, evala el conocimiento acerca de las operaciones bsicas
Una vez ajustado el esquema descriptivo en funcin los juicios de los expertos, el
constructor de pruebas criteriales todava tiene una serie de decisiones que
tomar antes de redactar los reactivos, las cuales tienen que ver con el formato
de la prueba que va a emplear, as como el nmero y tipo de items que deber
elaborar.
Etapa Preparatoria
2. El nivel estimado de funcionamiento de los examinados; cuando se
suponga que tal nivel de funcionamiento es alto, se deben emplear
ms items que cuando se estime que es bajo.
Preparatoria
transformar informacin de prosa a grfico o viceversa; a items de
verdadero falso si quiere saber si una gama de conductas est dentro
del repertorio de un examinado; o a items de eleccin mltiple si la
persona debe efectuar algn proceso de evaluacin y sntesis.
Etapa
homogneos en tanto sean congruentes con las especificaciones del
test.
Una vez que se han llevado a cabo estas actividades el constructor de prueba
Procedimientos a priori
Para efectuar este anlisis se recurre, una vez ms, a expertos en el rea
examinada, quienes deben evaluar la congruencia de los items con las
especificaciones de las cuales ellos se derivaron. Cada experto deber sealar si
un item es congruente o no con sus especificaciones y en los casos de
incongruencias deber sealarlo argumentando tal categorizacin. Aquellos
reactivos considerados congruentes por todos los expertos van directamente a la
prueba, pero cuando dos o ms expertos lo identifican como incongruente y
sealan las mismas razones, hay evidencias suficientes para descartarlo. Si slo
un experto hace algn sealamiento en torno a un reactivo ste deber ser
mejorado en el sentido sealado por ese experto.
Procedimientos a posteriori
Una vez que los reactivos han sido sometidos a un anlisis de congruencia por
parte de un panel de expertos, el constructor de la prueba efecta los ajustes
correspondientes y procede al llamado anlisis a posteriori, el cual consiste en
adelantar una evaluacin estadstica de los items y de la prueba total, una vez
que administrada a un grupo de criterio. Los miembros de dicho grupo, se
seleccionan segn su nivel de conducta en el rea evaluada de un modo
absolutamente intencional, nunca azaroso; es decir, si la prueba realiza
diagnsticos de lesiones cerebrales, la muestra de criterio debe estar conformada
por personas que hayan sufrido un accidente cerebrovascular o algn otra tipo de
afectacin
Etapa Exploratoria
y posteriormente se detallarn los estadsticos pertinentes para evaluar
los items de pruebas criteriales.
Diseos
Diseo de Dos Grupos o de Grupos Contrastados
Etapa Exploratoria
podran afectar su investigacin tales como la maduracin, la
adivinacin, la memoria, el mismo test, etc. e introducir los mecanismos
de control de variables extraas que pudieran afectar los datos.
Anlisis Estadsticos
Etapa Exploratoria
cercano a 1 ms fcil ser el reactivo, mientras ms cercano a cero ms
difcil resultar; as, un item cuya p=0.60 informa que el 60% de las
personas del grupo lo contest correctamente.
Etapa Exploratoria
ejecucin en los reactivos y no antes; ello hace del 2 un item
descartable. Los planteamientos que muestran el mismo
comportamiento tanto en el pre como en el postest tambin deben ser
eliminados puesto que no suministran capacidad discriminativa a la
prueba, lo cual se puede observar en el item 3 que fue contestado
correctamente tanto en el pre como en el postest por el 20% de las
personas, resultando cero su capacidad discriminativa.
Experimental
instrumento han sido analizados y ajustados segn las
directrices de los anlisis cualitativos y cuantitativos de los
ejercicios pilotos llevado a cabo durante la etapa exploratoria,
Etapa
Confiabilidad
La confiabilidad de una prueba criterial alude a la consistencia o repetibilidad con la
cual se puede describir el comportamiento de una persona en relacin a ese dominio
conductual. El constructor de este tipo de pruebas puede dar cuenta de tal
consistencia o repetibilidad en uno en distintos sentidos: o bien determinar cun
estables en el tiempo son las decisiones que la prueba ayuda a tomar; precisar cun
equivalentes son dos pruebas paralelas a la hora de tomar decisiones; o verificar si la
prueba es internamente consistente; o conocer el acuerdo entre observadores
necesario cuando el instrumento sea de calificacin semiobjetiva. Seguidamente cada
uno de ellos.
Para superar tal limitacin dentro del contexto de las pruebas referidas
a un criterio se ha propuesto el clculo de una variedad de ndices,
entre los cuales Almerich y Bo Bonet (2006) refieren las propuestas de
Hambleton y Novick, Livingston, Berk y Subkoviak, y muy especialmente se
destaca el procedimiento usado por Popham.
Etapa Definitiva
Popham (1978) propone un esquema de trabajo parsimonioso a la hora
de determinar la estabilidad temporal de las decisiones tomadas. En
tanto la idea es responder la pregunta es consistente este instrumento
al clasificar a las personas en una de dos (aceptados y rechazados) o
ms (normal, anorexia subclnica, anorexia) categoras?, la respuesta
podra conllevar a: 1. administrar la prueba (test) y clasificar a las
personas en la categora correspondiente; 2. tiempo despus repetir el
proceso (retest) con las mismas personas; y 3. correr alguna prueba de
significacin estadstica (Chi Cuadrado 2, p.e.). En el caso de que no
se rechace la hiptesis nula, se puede afirmar que el instrumento lleva a
tomar ms o menos las mimas decisiones en los dos momentos, lo cual
implica que es consistente a la hora de tomar decisiones.
Formas Paralelas
Hay ocasiones en las que se requiere ms de una forma de un mismo test como,
por ejemplo, cuando se aplica una misma prueba con mucha frecuencia o
cuando se necesita administrar el instrumento en un pre y postest, pero el
intervalo es muy corto para garantizar que la misma prueba no funcione como
variable extraa. En tales casos el constructor de pruebas puede recurrir a
Para preparar dos pruebas equivalente se elaboran los reactivos de cada una de
las formas a partir del mismo Esquema Descriptivo para luego adelantar los
anlisis de congruencia y estadsticos reseados antes, manteniendo siempre en
mente que dichas formas deben poseer homogeneidad derivativa.
Posteriormente, se administran esas dos pruebas consecutivamente a un grupo
de criterio y los datos obtenidos se procesan estadsticamente (Chi Cuadrada 2,
pe.); si no existen diferencias significativas entre los datos derivados de las dos
pruebas equivalente se implica que sus resultados son repetibles, de lo que se
afirma que poseen confiabilidad de formas paralelas.
Consistencia Interna
Etapa Definitiva
homogeneidad de un rea o dimensin, para as dar cuenta de la
confiabilidad de consistencia interna del instrumento.
Hay que ser especialmente cuidadoso cuando se analicen reactivos que midan un
dominio heterogneo para no sobrexigirles indicadores de homogeneidad cuando
efectivamente el dominio es heterogneo. As, cuando los datos revelen
heterogeneidad, corresponde al constructor de test analizar cualitativamente los
reactivos y contrastarlos con las especificaciones de la prueba, a los fines de
detectar si esa heterogeneidad es caracterstica de la variable, caso en el que no
se le hacen ajustes; o si es necesario modificar los reactivos.
Etapa Definitiva
antes no son excluyentes entre si; es decir, si para probar la calidad de
un instrumento se requieren determinar su confiabilidad de retest y de
consistencia interna, ambos procedimientos deber ser llevados a cabo,
as como igual que cualquier otra combinacin que sea pertinente. La
segunda es que, el diseador de pruebas est en el deber de reportar
detalladamente en el manual los procedimientos, muestras de personas
y resultados de los estudios de confiabilidad adelantados, con el objetivo
de proveer a los eventuales usuarios de recursos para tomar decisiones
acerca de la conveniencia de emplear el instrumento en cuestin.
Validez
Dado que un test criterial se puede emplear para describir un dominio particular
o para predecir otra variable, su construccin conlleva la implementacin de
estudios que garanticen que el instrumento sirve a estos fines (Linn, 1980), para
lo cual el diseador puede recurrir a tres tipos de enfoques de validacin; a
saber, validez de seleccin de dominio, validez descriptiva y validez funcional
(Popham, 1978), cada una de las cuales son detalladas de seguida.
Esta tiene que ver con dar cuenta de que el instrumento muestrea
adecuadamente el universo a examinar, por lo cual se afirma que alude
fundamentalmente a la calidad con la que se delimita el dominio medido, con las
especificaciones de la prueba y con la pertinencia de los reactivos preparados.
Aunque este tipo de validez se delimita en esta Etapa Definitiva del diseo de un
instrumento, su constructor trabaja en ella desde el momento mismo de su
conceptualizacin al: 1. delimitar el dominio a examinar; 2. hacer que paneles de
expertos examinen su tabla de especificaciones; 3. preparar los reactivos en
funcin de ella; 4. solicitar que otro panel de expertos evale la congruencia de
los items en relacin a las especificaciones; y 5. dar preponderancia a las
evaluaciones cualitativas sobre las cuantitativas de los reactivos.
Etapa Definitiva
examinar. Adicionalmente, debe seleccionar apropiadamente al panel
de expertos que examinrn las especificaciones de la prueba e
implementar los juicios de congruencia de los items; mientras ms
numerosos y calificados acadmica y experiencialmente sean, mayores
garantas se tendr de que la prueba posee validez de seleccin de
dominio.
Validez Descriptiva
Etapa Definitiva
tres personas para que juzguen la homogeneidad derivativa de los
reactivos; si la mayora de los items (90% o ms) son relacionados con
su especificacin correspondiente (multiplicacin de fracciones p.e.) se
puede afirmar que cualquier usuario del PM5 ser capaz de comprender
las especificaciones de la prueba y describir apropiadamente la
ejecucin de un examinado.
Validez Funcional
Tipos de Calificaciones
Al tiempo que el constructor de una prueba criterial delimita el dominio
a medir esquematiza una escala para reportar la ejecucin en la
prueba, la cual le permitir comunicar el nivel de ejecucin de la
persona examinada. Para precisar la escala que emplear debe
considerar los fines del instrumento: si ser empleado para describir la
ejecucin, se recurrir al diseo de escalas relacionadas con el
Etapa Definitiva
contenido, pero si se usar para estimar la ejecucin en un criterio se
recurrir a escalas relacionadas con el rendimiento.
Etapa Definitiva
considerar que poseen el mismo significado; y una calificacin de 31
puntos tendr el mismo significado que una de 40. Esta es considerada
una limitacin de tales puntajes y la razn por la cual suelen emplearse
en conjunto con otro tipo de calificaciones.
Etapa Definitiva
expresada en estndares de contenido, por lo que tienen varios rangos
de calificaciones. Uno de esos rangos es, por ejemplo, el estndar de
contenido de 26 al 30, que permite afirmar acerca de un alumno que
caiga en ese rango que Demuestra destrezas de lectura que van ms all de
las exigencias establecidas para el dcimo grado en Carolina del Norte. Comprende
una variedad de textos informativos, argumentativos y expresivos. Es capaz de
evaluar relaciones causa/efecto, problemas/soluciones expresados en textos La
prueba dispone de una descripcin anloga a la reseada para cada uno
de los rangos de puntajes.
Escalas de Clasificacin
Etapa Definitiva
justamente asignar determinado rtulo al evaluado a los fines de
segmentarlo y separarlo de otros posibles diagnstico, con lo cual este
tipo de calificacin suele ser ms frecuente en Psicologa.
Etapa Definitiva
permite estimar que ese nio tendr una probabilidad del 25% de
obtener una calificacin de REGULAR en 6to Grado; que no tiene
probabilidad de que califique como EXCELENTE; y, que existe una
probabilidad del 75% de que califique como DEFICIENTE.
Tabla 4
Nivel predictivo de Ejecucin para la PM5
100
90
PM5
6 o Grado 80
Matemticas 6to
70
60
20 89,4
Grado
50
40
30
20
19 74,1 10
0
0 5 10 15 20
18 60,3
PM5: Predictor
17 57,2
Figura 1. Nivel Predictivo de ejecucin para la PM5
de garantizar su calidad.
Los test criteriales se utilizan cuando el objetivo es describir lo que una persona
puede o no hacer respecto a un dominio, cuando se necesita clasificar a las
personas en atencin a las conductas que se en su repertorio; de modo que
informa, por ejemplo, que un nio exhibe unos patrones conductuales que
apuntan a un trastorno por dficit de atencin con hiperactividad, con
predominio hiperactivo-impulsivo (HI). Por su parte, las pruebas normativas se
emplean cuando el inters es identificar diferencias individuales a partir de la
comparacin del comportamiento entre las personas, es as como se puede
Las pruebas criteriales exigen una evaluacin exhaustiva del dominio que
examinan, de modo de disponer de un muestreo representativo de las tareas o
conductas cubiertas por la prueba; as lo que sea cierto para esa muestra de
conductas tambin lo sea para el universo de conductas. Las pruebas normativas
atienden menos al contenido por si mismo y se concentran en demostrar
numricamente que existe una relacin entre cada elemento de la prueba con la
variable examinada.