You are on page 1of 88

Diseado por: Germn Andrs Torres Escobar

PSICOMETRA

Hitos en la historia de la psicometra


AO
1115 a.C. 1869 d C. 1904 1910 d. C. 1905 d.C. 1918 d.C.

HITO O ACONTECIMIENTO
En China se utilizan tests para acceder a puestos en el gobierno. Francis Galton publica el libro Genio Hereditario (1869) donde plantea a travs de estudios estadsticos que la inteligencia se hereda. Charles Spearman funda la Teora Clsica de los tests o del modelo lineal y publica su teora de los factores de la inteligencia y las formulas de atenuacin. Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para nios, con el fin de establecer su edad mental y predecir su rendimiento acadmico. Se crean los tests de inteligencia Army Alpha y Beta para clasificar a los soldados durante la Primera Guerra Mundial y Robert Woodworth elabor el primer Personal Data Sheet para detectar los soldados que pudieran tener crisis nerviosas. Thurstone publica su libro The reliability and validity of tests. Wechsler propone su escala de medida para la inteligencia. Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality Inventory (MMPI). Cronbach propone su Teora de la Generalizacin en la cual utiliza el anlisis de varianza para interpretar las fuentes de error en los puntajes. Rasch plantea la Teora de la Respuesta al tem o del rasgo latente que permite conocer la informacin de cada tem para disear pruebas individualizadas.

1931 d.C. 1939 d.C. 1940 d.C. 1960 d.C. 1980 d.C.

La psicometra

Es la rama de la psicologa que desarrolla y estudia las propiedades de las pruebas psicolgicas o tests para medir las variables psicolgicas con la mayor precisin posible.

Diferencia entre psicometra y evaluacin psicolgica


Psicometra Evaluacin psicolgica

nfasis en la medicin

nfasis en el diagnstico

Instrumentos y tests

La persona

Historia de la psicometra
Antecedentes

histricos.

Modelos

de medicin.

Antecedentes histricos

Hacia el ao 1115 a.C. se utilizan comienzan a utilizar en China los primeros tests que buscan medir las capacidades de aspirantes para acceder a puestos del gobierno (primera medicin de capacidades).
En 1869 Francis Galton publica el libro Genio Hereditario donde plantea a travs de estudios estadsticos que la inteligencia se hereda y que es posible medirla (estudios estadsticos en psicologa).

Entre 1904 y 1910 Charles Spearman funda la Teora Clsica de los tests o del modelo lineal y publica su teora de los factores de la inteligencia y las formulas de atenuacin (Estrategias de medicin y TCT). En 1905 Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para nios, con el fin de establecer su edad mental y predecir su rendimiento acadmico (uno de los primeros tests psicolgicos).

En 1960 Lee Cronbach propone su Teora de la Generalizacin en la cual utiliza el anlisis de varianza para interpretar las fuentes de error en los puntajes. Igualmente l desarroll estrategias para la medicin de la confiabilidad de un test. En 1980 Rasch plantea la Teora de la Respuesta al tem o del rasgo latente que permite conocer la informacin de cada tem para disear pruebas individualizadas.

Modelos de medicin
Teora Clsica de los Tests (TCT) Teora de la Respuesta al tem (TRI)

Anlisis de la prueba completa

Anlisis de tems individuales

En una muestra pequea de sujetos (N < 500)

En grandes muestras de sujetos (N 500)

Teora clsica de los Tests

El modelo de puntuacin verdadera se concreta en un primer supuesto: X=V+E que indica que la puntuacin emprica directa de una persona en un test (X) est compuesta por la puntuacin verdadera de la persona (V) y un error de medida (E) que se comete al medir el rasgo con el test. El error de medida se establece como la diferencia entre la puntuacin emprica y la verdadera: E=X-V

La puntuacin verdadera se obtiene con el promedio de las puntuaciones empricas que obtiene la persona en un nmero elevado de aplicaciones del test: V = E[X] Si en una poblacin se conocen las puntuaciones V y E de los individuos, la correlacin entre ambas variables sera nula, porque se asume que puntuaciones verdaderas elevadas no tienen porqu tener asociados errores elevados:

r VE = 0

Si en una poblacin conociramos los errores de medida de cada individuo quien ha realizado dos tests diferentes (j y k), la correlacin entre ambas variables tambin sera nula:

E jEk = 0

Si en una poblacin conociramos las puntuaciones E en un test j y las puntuaciones V en un test k, ambas variables correlacionaran cero:

E jVk = 0

Limitaciones de la Teora Clsica

Las caractersticas de los tems (dificultad y discriminacin) dependen del grupo de personas en el que se han aplicado.

La puntuacin que una persona obtenga ser diferente si se le aplican dos tests que midan la misma caracterstica pero cuyo nivel de dificultad sea diferente. La TCT supone que el error de medida es una propiedad del test y, por lo tanto, igual para todos los sujetos, independientemente de cual sea su puntuacin.

Teora de la Respuesta al tem

Unidimensionalidad: todos los tems que forman el test han

de medir un mismo y nico rasgo. El supuesto de unidimensionalidad exige que todos y cada uno de los tems del test midan una nica dimensin. No hay como tal puntuaciones verdaderas sino una probabilidad de acierto determinada por unos parmetros.

Independencia local: entre los tems de un test si la respuesta

que una persona da a uno de ellos no depende de las respuestas que da a los otros, ni por el orden de presentacin de los tems, las respuestas que ya se hayan dado, etc.

Un prueba psicolgica o test

Es un instrumento en formato impreso o digital que consta de una serie de preguntas o reactivos que miden unas variables psicolgicas especificas a travs de un sistema de puntuacin. Puede aplicarse en diferentes campos de la psicologa, para fines diversos como diagnstico clnico (psicologa clnica) , seleccin de personal (psicologa organizacional) o anlisis de aptitudes vocacionales (psicologa educativa).

Estructura general de un test impreso

Cuadernillo de instrucciones.
Cuadernillo de preguntas. Hoja(s) de respuestas. Plantilla de correccin. Tabla de puntuaciones y baremos.

El cuadernillo de instrucciones

Es un documento donde se menciona: El nombre de la prueba, sus autores y el ao de publicacin. La(s) variable(s) que mide y sus objetivos. Los antecedentes (marco conceptual y terico) de la prueba. Las instrucciones generales de aplicacin (para los psiclogos).

El cuadernillo de preguntas

Es un documento que consta de: Las instrucciones de respuesta (para quien la va a responder). Los tems o preguntas.
No puede rayarse ni se puede escribir sobre este ya que se usa en diferentes aplicaciones.

La hoja de respuestas y plantilla de correccin

Es la hoja donde la persona anota las respuestas a de los tems planteados en el cuadernillo de preguntas.
Una vez que la persona entrega la hoja de respuestas al psiclogo, l o ella la califican poniendo encima de la hoja de respuestas, la plantilla de correccin para ver en cuales acert el sujeto y en cuales no.

El sistema de puntuacin
Puntuacin cruda o bruta Puntuacin de los tems Errores Puntuacin estndar o tpica Centiles Puntuaciones T, S o Z Perfil del sujeto

La tabla de puntuaciones y baremos

Una vez que se han obtenido los aciertos y errores de la persona con ayuda de la plantilla, se obtiene una puntuacin cruda o bruta, que es especifica para ese sujeto.
Esa puntuacin bruta se analiza en la tabla de puntuaciones estndar, para obtener una puntuacin estndar o tpica del sujeto dentro de la poblacin o muestra de sujetos que present la prueba (baremo).

Los baremos

Son tablas de puntuaciones estndar que se clasifican por grupos poblacionales o muestrales segn la edad, profesin o gnero.
Por ejemplo, para una misma prueba existen baremos para hombres, mujeres, hombres profesionales, mujeres profesionales, estudiantes de secundaria, etc.

Tipos de pruebas o tests


Clasificacin de las pruebas Segn la aplicacin Segn la forma de medir la(s) variable(s) -De desempeo - De poder - De velocidad Segn la(s) variable(s) que miden - De capacidad mental - De conocimientos - De personalidad

- Autoaplicacin
- Individual - Grupal

Clasificacin de las pruebas por aplicacin

Pruebas de autoaplicacin: son tests que no requieren la


aplicacin por parte de un psiclogo sino que puede hacerlas la persona con ayuda de un computador.

Pruebas de aplicacin individual: son aquellas que el

psiclogo administra a una sola persona. Por ejemplo, en un caso clnico.

Pruebas de aplicacin grupal: son aquellas que el

psiclogo pueden aplicar a varias personas al mismo tiempo, pero controlando que no conversen entre ellas. Por ejemplo, una prueba de aptitudes e intereses vocacionales.

Clasificacin de las pruebas segn la forma de medir la(s) variable(s)

Pruebas de desempeo: miden el rendimiento mximo


(individual) o el rendimiento normal o tpico (de un grupo). un sujeto o su nivel de conocimiento.

Pruebas de poder: miden el nivel de destreza mental de


Pruebas de velocidad: miden cuantos tems responde el
sujeto en un tiempo especifico.

Pruebas con referencia a la norma o al criterio: mide la


variables psicolgica segn objetivos especficos.

Clasificacin de las pruebas segn las variables que miden

Pruebas de capacidad mental (inteligencia).


Pruebas de aprovechamiento o conocimiento. Pruebas de personalidad. Pruebas de actitudes, aptitudes, motivacin, opinin y valores. Pruebas neuropsicolgicas. intereses,

Estructura general de un tem

Enunciado: menciona las instrucciones para contestar el

tem y plantea un contexto o situacin a partir del cual se hace la pregunta.

Pregunta(s):

son cuestionamientos que evalan directamente la variable psicolgica de forma implcita. Pueden ser abiertas (libre respuesta) o cerradas (opciones especificas).

Opciones de respuesta: incluyen una(s) respuestas(s)


correcta(s) falsa(s). y un(os) distractor(es) o

respuesta(s)

Clasificacin del formato de respuestas


Clasificacin de los tems
En tests de rendimiento ptimo

En tests de rendimiento tpico


- De opcin binaria

- De eleccin - De emparejamiento

- De categoras ordenadas

- De adjetivos

Clasificacin de las respuestas en tests de rendimiento ptimo

Eleccin binaria: de dos alternativas, se elige la


que se considera (verdadero-falso). correcta (S o No) o

Eleccin mltiple: entre ms de dos alternativas


se elige la que se considera correcta.

Emparejamiento: consiste en encontrar las


parejas entre dos conjuntos de conceptos.

Clasificacin de las respuestas en tests de rendimiento tpico

Opcin binaria: la persona debe manifestar si est de


acuerdo o en desacuerdo con una afirmacin.

Categoras ordenadas: el formato establece un continuo

ordinal de ms de dos categoras, que permite a la persona matizar mejor su respuesta.

Adjetivos bipolares: este formato es tpico de lo que se


denomina "diferencial semntico".

Confiabilidad

Es el grado en el cual las mediciones repetidas de un fenmeno relativamente estable son aproximadas entre s o consistentes.
Permite predecir el desempeo de un grupo o de un sujeto e igualmente sirve para describirlo en ambos casos.

Formas de medir la confiabilidad

Test-retest: consiste en aplicar un test dos veces a un mismo grupo en un intervalo de das o meses (no superior). Formas paralelas: consiste en aplicar un test homologo o equivalente a un mismo grupo pero en tiempos diferentes. Divisin por mitades: consiste en comparar los resultados de los tems pares e impares en la aplicacin grupal de un test.

Coeficientes de confiabilidad

Test-retest: coeficiente de estabilidad (r).


Formas paralelas: equivalencia (r). coeficiente de

Divisin por mitades: consistencia interna (r).

coeficiente

de

Coeficientes ms usados en divisin por mitades

Formas de mejorar la confiabilidad de un test

Para calcular el nmero de tems K para lograr una confiabilidad RXY deseada (superior a 0.7) se usa la formula: K = RXY * (1 rXY) / rXY) * (1 RXY) donde rX es la confiabilidad inicial. Una vez obtenido el nmero K se multiplica por el nmero de items inicial y luego se le resta a ese resultado el nmero de tems inicial.

Para calcular la confiabilidad al quitar un nmero de tems X con un total de tems Y y con una confiabilidad conocida C se usa la siguiente formula: YX/Y El resultado obtenido con esta formula debe operarse con la formula 2: [resultado 1 * C] [1 + (resultado 1 1) * C]

VALIDEZ

Es el grado en el cual una prueba mide lo que pretende medir.


Conjunto de pruebas y datos que han de recogerse para garantizar la pertinencia predictiva de las inferencias que hacen a partir de un test.

Tipos de validez

Validez del contenido.


Validez con relacin a criterio. Validez del constructo.

VALIDEZ DEL CONTENIDO

Es la muestra adecuada y representativa de los contenidos que se pretende evaluar con un test. Los tems o preguntas se seleccionan segn su: Coherencia: con las caractersticas y variables. Relevancia: de acuerdo con el indicador. Buena redaccin: la gramtica del tem. Validez aparente: para el evaluado.

VALIDEZ CON RELACIN AL CRITERIO

Es la comparacin del desempeo de un grupo de sujetos en un test respecto patrones de medida ya establecidos.
Se clasifica en: Validez concurrente. Validez predictiva.

Validez concurrente

Es el anlisis de variabilidad que efecta al comparar el desempeo de dos grupos de distintos de sujetos en un mismo test.
Tambin se le denomina validez cruzada o entre distintas muestras.

Validez predictiva

Es el grado de precisin con que las calificaciones de la prueba predicen las calificaciones del criterio.
Se obtiene mediante la correlacin entre una variable de indicador y una variable criterio a partir de r (Pearson), cuyo valor es igual o menor a 0,60.

Factores que afectan la validez con relacin a los criterios

sexo, edad y rasgos de personalidad.

Las diferencias de grupo:

evidencias falsas que les restan validez.

La contaminacin de los criterios:

nmero de personas que poseen la variable medida.

El ndice de base (debe ser mayor de 50): El incremento de la validez:

costo razonable del instrumento.

VALIDEZ DEL CONSTRUCTO

Es el grado de exactitud con el que se mide un constructo o concepto psicolgico particular.


Depende de unas condiciones que son externas al evaluador y la persona que disea la prueba.

Condiciones de la validez del constructo

Valoracin por parte de jueces expertos de la correspondencia contenido-concepto. Anlisis de la consistencia interna de la prueba. Estudio de las variables intervinientes en la calificacin.

Anlisis factorial y correlacin con otras pruebas. Anlisis de las respuestas. Correlaciones altas con otras medidas o mtodos para medir el mismo constructo (Validez convergente). Correlaciones bajas con las medidas de constructos diferentes (Validez discriminante).

CONSTRUCCIN DE LOS TEMS

La Taxonoma de Bloom

1.

2.
3. 4. 5. 6.

El dominio cognoscitivo comprende 6 categoras: Recuerdo Comprensin Aplicacin Anlisis Sntesis Evaluacin

La Taxonoma de Bloom
Recuerdo:
Incluye situaciones de examen que acentan la importancia del recuerdo de datos, ideas, materiales o fenmenos, ya sea como reconocimiento o evocacin. Supone, el recuerdo o reconocimiento de: Datos especficos como terminologas o hechos; modos y medios para el tratamiento de datos especficos como convenciones, clasificaciones, metodologas, tcnicas o procedimientos y, universales y abstracciones en un campo determinado como principios, generalizaciones, teoras y estructuras (Herrera, 2003).

La Taxonoma de Bloom
Ejemplo 1: Pregunta que evala Recuerdo

A continuacin encontrar preguntas que constan de un enunciado y cuatro (4) o cinco (5) opciones de respuesta. Usted debe marcar en su hoja de respuesta, aquella opcin que considere correcta. El modelo de control social propuesto por Max Weber para las organizaciones, se denomina modelo: A.- de los sistemas B.- burocrtico C.- estructuralista D.- de las organizaciones

La Taxonoma de Bloom
Comprensin: Implica la inteleccin y fraccionamiento de un mensaje. Operacionalmente se define como cualquier conducta que vaya desde la presentacin de una proposicin con palabras distintas de las del enunciado original, hasta la aplicacin de un principio en una situacin nueva para el examinado, pasando por la ejemplificacin. Se define en trminos de tres operaciones: a)

Traduccin o capacidad para expresar un concepto o mensaje conocido en palabras diferentes o pasarlo de un sistema simblico a otro, b) Interpretacin o reordenamiento de ideas de una comunicacin en una nueva configuracin. Incluye la habilidad para captar el contenido de una comunicacin como un todo y distinguir entre conclusiones legtimas y contradictorias y c) Extrapolacin o hacer explcitas algunas conclusiones, colorarios, consecuencias o efectos de una comunicacin dada (Herrera, 2003).

La Taxonoma de Bloom
Ejemplo 2: Pregunta que evala Comprensin

Si un psiclogo afirma que una prueba que ha preparado para seleccin de personal tiene un coeficiente de validez predictiva mas alto que el de fiabilidad, concluira que A. est bien, por cuanto lo mas importante para la seleccin es la validez de prediccin B. debera tener mas alta fiabilidad que validez ya que lo principal es la confianza en el instrumento C. debe tener un error ya que la validez predictiva NO puede ser mayor al coeficiente de fiabilidad D. debe tener un error ya que los dos coeficientes, el de validez y el de fiabilidad deben tener igual valor E. no debera utilizar la prueba ya que debe tener mas alta fiabilidad que validez para el objeto propuesto

La Taxonoma de Bloom
Aplicacin:
Se refiere a la capacidad para aplicar teoras, principios, mtodos o ideas en la solucin de un problema prctico. Es la habilidad para aplicar principios y generalizaciones a nuevos problemas y situaciones. Comprende entonces tareas como a) identificar los principios o generalizaciones apropiados para resolver un problema o reformularlo para lograr tal identificacin, b) especificar los lmites dentro de los cuales un principio o generalizacin es verdadero o relevante y reconocer las excepciones a los mismos y las razones para ello, c) explicar nuevos fenmenos a partir de principios o generalizaciones conocidas, predecir lo que suceder en una situacin nueva mediante el uso de principios y generalizaciones apropiadas, y d) determinar o justificar una decisin o accin en una situacin usando principios o generalizaciones e indicar el razonamiento que apoya la utilizacin de los mismos ante un determinado problema (Herrera 2003).

La Taxonoma de Bloom
Ejemplo 3: Pregunta que evala Aplicacin

Escoja la caracterstica del pensamiento infantil que mejor se ajusta a la conducta descrita por Piaget: - Cmo se hace para tener madera? Se cortan los troncos de los rboles. - Qu se hace para tener rboles? Se siembran los granos. - Y los granos? Se compran. - Dnde? En los almacenes. - Y el dueo del almacn? Pinsalo un poco. Los hace. - Con qu? Con otros granos. - Cuando vinieron los primeros hombres, haba ya rboles? No. - Cmo han comenzado? Por los granos. - De dnde venan estos granos? Del almacn. A. B. C. D. E. Realismo Animismo Artificialismo Sincretismo Funcionalismo

La Taxonoma de Bloom
Anlisis:
Hace referencia a la habilidad para fraccionar una comunicacin en sus elementos, de manera que aparezcan explcitas la jerarqua de las ideas y las relaciones existentes entre ellas. Esta es un proceso complejo que implica las tres categoras anteriores; recuerdo, comprensin y aplicacin, pero va mas all de ellas. Aqu se incluyen tres subcategoras: a) anlisis de elementos o habilidad para fraccionar una informacin en sus elementos, como supuestos no explcitos, hechos e hiptesis; b) anlisis de relaciones o identificar la relaciones que existen entre los elementos de una comunicacin; inferir los criterios, relaciones, cualidades, suposiciones o condiciones implcitas en una comunicacin; o bien, determinar las relaciones entre las hiptesis y las pruebas que la apoyan, entre las conclusiones y las hiptesis, o entre las conclusiones y las evidencias; y c) anlisis de principios de organizacin que es la habilidad para explicitar los principios organizadores que ha seguido un autor, reducir su propsito, su punto de vista, su actitud o su interpretacin (Herrera 2003).

La Taxonoma de Bloom
Ejemplo 4: Pregunta que evala Anlisis

Considere los resultados del siguiente estudio: En una investigacin sobre heredabilidad de rasgos psicosociales, en este caso la criminalidad, se conformaron tres grupos de sujetos as: el grupo A por parejas de gemelos univitelinos, el grupo B por parejas de gemelos bivitelinos y el grupo C por parejas de hermanos naturales. En ningn caso los hermanos fueron separados. Una vez aplicados los instrumentos de medida (cuestionarios, encuestas, etc.,), se encontraron los siguientes porcentajes de acuerdo en relacin con la presencia de conductas criminales: GRUPOS A B C % DE ACUERDO 77 35 8 Escoja la interpretacin que mejor se ajuste a los datos de la investigacin A. A mayor concordancia gentica corresponde un mayor porcentaje de acuerdo B. La criminalidad depende del medio ambiente en un 23%. C. El bajo porcentaje registrado por el grupo C se debe a que es el grupo con el menor nivel de homogeneidad gentica
D. No se puede concluir en favor de la heredabilidad de las conductas criminales.

La Taxonoma de Bloom
Sntesis: Es la capacidad para reunir diferentes elementos o partes para formar un todo. Esto es, la habilidad para combinar elementos con el fin de constituir una estructura o esquema que no estaba presente con claridad. La capacidad de sntesis incluye: a) produccin de una comunicacin nica, b) produccin de un plan o conjunto de operaciones con un fin determinado y c) derivacin de un conjunto de relaciones abstractas, explicaciones o hiptesis para dar cuenta de un fenmeno dado. Es difcil construir preguntas estructuradas que evalen esta categora, son mucho ms frecuentes las preguntas abiertas de tipo ensayo (Herrera 2003).

La Taxonoma de Bloom
Evaluacin: Es la capacidad para emitir juicios sobre ideas, obras, mtodos, materiales o soluciones, con algn propsito determinado. Esta categora incluye formulacin de juicios: a) con base en pautas internas como exactitud, precisin y cuidado con que ha sido elaborada una comunicacin dada; consistencia de los razonamientos, relaciones entre supuestos, evidencias y conclusiones y reconocimiento de los valores y puntos de vista utilizados en un juicio particular sobre una obra b) en trminos de criterios externos como comparacin de un trabajo u obra con otros, utilizando criterios o normas explcitas. Al igual que en la categora anterior, es difcil construir preguntas estructuradas que evalen esta categora, son ms apropiadas las preguntas abiertas de tipo ensayo (Herrera 2003).

Tipos de Preguntas
NOMBRE ELEMENTOS CARACTERISTICAS

Eleccin mltiple con nica respuesta Eleccin mltiple con mltiple respuesta Informacin suficiente Anlisis de postulado s Anlisis de relaciones

Un enunciado y cuatro o cinco opciones de respuesta Un enunciado y cuatro (4) opciones de respuesta

Slo una de las opciones completa correctamente el enunciado. Puede utilizarse para evaluar cualquier objetivo educativo especialmente recuerdo, comprensin y aplicacin. Una, dos, tres o todas las opciones de respuesta pueden completar correctamente el enunciado, el examinado debe elegir una combinacin de ellas. Adecuado para evaluar cualquier objetivo educativo. Una o las dos informaciones pueden ser necesarias y suficientes para resolver el problema o pueden ser necesarias pero no suficientes. El evaluado no debe resolver el problema, slo evaluar la informacin disponible. Excelente para evaluar aplicacin. Tanto la afirmacin como los postulados son VERDADEROS. El examinado evala la relacin lgica entre ellos. Excelente para evaluar anlisis. Tanto la afirmacin como la razn pueden ser VERDADERAS o FALSAS. El examinado evala tanto su valor de verdad como la relacin lgica entre ellas. Excelente para evaluar anlisis.

Un problema y dos informaciones relacionadas con el mismo Una afirmacin y dos postulados Dos afirmaciones separadas por la palabra PORQUE

Eleccin Mltiple con nica Respuesta


Es el tipo de pregunta ms conocido y usado en las pruebas objetivas. Estn conformadas por un enunciado y cuatro (4) o cinco (5) opciones de respuesta. El enunciado puede contener una frase incompleta, una interrogacin, un texto o una grfica; las opciones de respuesta aparecen identificadas con las letras A, B, C, D y E. Una sola de las opciones completa o responde correctamente el enunciado. Este tipo de pregunta es til para evaluar cualquiera de las cuatro primeras categoras de la taxonoma de Bloom. Los ejemplos 1 a 4 son preguntas de eleccin mltiple con nica respuesta.

Eleccin Mltiple con nica Respuesta


Adems de las consideraciones generales sobre construccin de preguntas, en este tipo de tems es altamente recomendable evitar expresiones como TODAS LAS ANTERIORES o NINGUNA DE LAS ANTERIORES. Si ms de una opcin es correcta probablemente la pregunta quede mejor formulada con el formato de eleccin mltiple con mltiple respuesta.

Eleccin Mltiple con Mltiple Respuesta


Este tipo de pregunta consta de un enunciado y cuatro (4) opciones de respuesta identificadas con los nmeros 1, 2, 3 y 4. Una o varias opciones de estas pueden completar correctamente el enunciado. Este tipo de pregunta es til para evaluar cualquiera de las categoras de objetivos educativos. Sin embargo, se usa frecuentemente para evaluar comprensin y aplicacin utilizando: a) una situacin en la que es necesario considerar varias consecuencias posibles, b) una situacin en la que es necesario especificar una o ms condiciones para definirla adecuadamente, c) dos situaciones semejantes o dismiles con respecto a uno o ms puntos de comparacin, d) un principio que puede aplicarse a ms de una situacin o e) varias consideraciones que pueden conducir al mismo

Eleccin Mltiple con Mltiple Respuesta


Las instrucciones que se dan al examinado son, generalmente de la siguiente forma:

"A continuacin encontrar preguntas que constan de un enunciado y cuatro (4) opciones de respuesta. Una o varias opciones pueden completar correctamente el enunciado. Usted debe marcar su hoja de respuestas segn el cuadro siguiente: Marque A Marque B Marque C Marque D si las opciones 1, 2 y 3 son correctas si las opciones 1 y 3 son correctas si las opciones 2 y 4 son correctas si slo la opcin 4 es correcta

Eleccin Mltiple con Mltiple Respuesta


Este tipo de pregunta no debe incluir distractores mutuamente excluyentes por cuanto estaran anulando una o varias opciones de respuesta; tampoco debe incluir en las opciones de respuesta expresiones como TODAS LAS ANTERIORES o NINGUNA DE LAS ANTERIORES.

Eleccin Mltiple con Mltiple Respuesta


Ejemplo:

La investigacin emprica ha encontrado que:


1. Las personas toman menos tiempo en el aprendizaje de un concepto cuando hay muchos atributos irrelevantes 2. En el aprendizaje de un concepto son mejores los ejemplos negativos que los positivos 3. En el aprendizaje de un concepto la velocidad de aprendizaje es una funcin directa del nmero de atributos 4. Las personas toman ms tiempo en el aprendizaje de un concepto cuando hay muchos atributos relevantes

Informacin Suficiente
Estas preguntas constan de un problema y dos informaciones identificadas con los nmeros I y II. No se requiere que el examinado resuelva el problema, sino que decida si las informaciones proporcionadas son necesarias y suficientes para resolverlo. Este tipo de pregunta es muy til para evaluar aplicacin.

Informacin Suficiente
Las instrucciones son, generalmente, las siguientes:

"Las preguntas que encontrar a continuacin constan de un problema y dos informaciones identificadas con los nmeros I y II. Usted debe decidir si las informaciones son necesarias y suficientes para solucionar el problema y marcar su hoja de respuestas segn el cuadro siguiente: ... Marque A s necesita y basta con las informaciones I y II Marque B si necesita y basta con la informacin I Marque C si necesita y basta con la informacin II Marque D si cualquiera de las dos informaciones sirve Marque E si no es suficiente con las dos informaciones

Informacin Suficiente
Adems de las normas generales, para la construccin de este tipo de preguntas es necesario tener en cuenta: a) las informaciones NO deben ser contradictorias entre s o mutuamente excluyentes, b) en las preguntas de clave A, el problema debe poder solucionarse con las dos informaciones sin requerir de otra, c) en las preguntas de clave B, C o D, el problema planteado debe poder solucionarse con una sola informacin y d) en las preguntas de clave E las informaciones deben ser necesarias pero NO suficientes para resolver el problema.

Informacin Suficiente
Ejemplo 6: Pregunta de Informacin Suficiente

Se quiere comparar el tiempo de reaccin ante un estmulo en dos poblaciones. Se toman muestran aleatorias de las poblaciones, se recogen los datos y se elige un estadstico de prueba. Para decidir si se acepta o rechaza una hiptesis de igualdad de medias con un nivel de significancia , se requiere conocer: I. la distribucin del estadstico de prueba II. la probabilidad de obtener un valor mayor que el observado en el estadstico de prueba

Anlisis de Postulados

Este tipo de pregunta consta de una afirmacin y dos postulados identificados con los nmeros I y II. Entre la afirmacin y los postulados se encuentra la palabra POR CONSIGUIENTE. Para responder este tipo de pregunta el examinado no necesita evaluar el valor de verdad de las afirmaciones, todo se supone verdadero; solo debe analizar la relacin lgica existente entre afirmacin y postulados. Es un tipo de pregunta de difcil elaboracin y requiere de cuidadoso anlisis previo para que la respuesta sea inequvoca. Es muy adecuado para evaluar anlisis.

Anlisis de Postulados
Las instrucciones para responder este tipo de pregunta son, generalmente, como se muestra a continuacin

"Las preguntas que encontrar a continuacin constan de una afirmacin VERDADERA y dos postulados tambin VERDADEROS identificados con los nmeros I y II. Usted debe decidir si los postulados se deducen lgicamente de la afirmacin y contestar segn el cuadro siguiente: ... Marque A s de la tesis se deducen los postulados I y II Marque B si de la tesis solo se deduce el postulado I Marque C si de la tesis solo se deduce el postulado II Marque D si ninguno de los postulados se deduce de la tesis

Anlisis de Postulados
Ejemplo 7: Pregunta de Anlisis de Postulados Es inimputable quien comete el delito bajo influencia determinante de un trastorno mental POR CONSIGUIENTE I. Un psictico puede ser inimputable II. Un inimputable comete un hecho tpico y antijurdico pero no culpable ni punible

Anlisis de Postulados

Adems de las normas generales, para la construccin de este tipo de preguntas es necesario tener en cuenta: a) aun cuando la instruccin le indica al examinado que debe suponer todo verdadero, es recomendable que las afirmaciones lo sean en efecto o, por lo menos que no sean absurdos u obviamente falsos, b) todas las afirmaciones deben ser gramaticalmente completas e independientes unas de otras, c) la construccin de la pregunta debe ser tal que la deduccin lgica sea indiscutible, de manera que la respuesta correcta sea inequvoca y d) este tipo de pregunta es til para poblaciones de alto nivel educativo.

Anlisis de Relaciones

Las preguntas de este tipo presentan dos afirmaciones unidas por la palabra PORQUE y la segunda afirmacin se considera una RAZON verdadera o supuesta de la primera. El examinado debe evaluar tanto el valor de verdad de las afirmaciones como la relacin entre ellas. A diferencia de las preguntas de anlisis de postulados, en stas las afirmaciones pueden ser verdaderas o falsas. Este tipo de preguntas es particularmente til para evaluar anlisis y presenta menos dificultades prcticas que la pregunta de anlisis de postulados.

Anlisis de Relaciones
Las preguntas que encontrar a continuacin constan de una afirmacin y una razn unidas por la palabra PORQUE. Usted debe juzgar tanto el grado de verdad o falsedad de cada una de ellas como la relacin existente entre las mismas, y contestar en su hoja de respuestas segn el cuadro siguiente: Marque A si ambas afirmaciones son verdadera y la segunda es una razn o explicacin correcta de la primera Marque B si ambas afirmaciones son verdaderas pero la segunda NO es una razn o explicacin correcta de la primera Marque C si la primera afirmacin es verdadera pero la segunda es falsa Marque D si la primera afirmacin es falsa pero la segunda es verdadera
Marque E si ambas afirmaciones son falsas

Anlisis de Relaciones
Las preguntas que encontrar a continuacin constan de una afirmacin y una razn unidas por la palabra PORQUE. Usted debe juzgar tanto el grado de verdad o falsedad de cada una de ellas como la relacin existente entre las mismas, y contestar en su hoja de respuestas segn el cuadro siguiente: Marque A si ambas afirmaciones son verdadera y la segunda es una razn o explicacin correcta de la primera Marque B si ambas afirmaciones son verdaderas pero la segunda NO es una razn o explicacin correcta de la primera Marque C si la primera afirmacin es verdadera pero la segunda es falsa Marque D si la primera afirmacin es falsa pero la segunda es verdadera
Marque E si ambas afirmaciones son falsas

Anlisis de Relaciones

Para la construccin de este tipo de preguntas es necesario tener en cuenta: a) las afirmaciones no deben ser obviamente falsas u obviamente verdaderas, b) las afirmaciones no deben ser contradictorias entre s o mutuamente excluyentes y c) las afirmaciones deben estar construidas de manera que pueda juzgarse su verdad o falsedad independientemente, es decir, deben ser frases gramaticalmente completas.

Anlisis de Relaciones

Para la construccin de este tipo de preguntas es necesario tener en cuenta: a) las afirmaciones no deben ser obviamente falsas u obviamente verdaderas, b) las afirmaciones no deben ser contradictorias entre s o mutuamente excluyentes y c) las afirmaciones deben estar construidas de manera que pueda juzgarse su verdad o falsedad independientemente, es decir, deben ser frases gramaticalmente completas.

Anlisis de Relaciones
Ejemplo 8: Pregunta de Anlisis de Relaciones

El hemisferio cerebral izquierdo regula las contracciones musculares del lado derecho del cuerpo PORQUE las fibras motoras y sensitivas se cruzan en el bulbo

ANLISIS DE LOS TEMS

Estimacin de la Dificultad del tems


xito en la estimacin en contextos variados
Propiedades del sujeto Propiedades de los tems

Halo Juicios Subjetivos Calificacin Administracin Rapport

Azar

Covarianza con la prueba (Homogeneidad) Frecuencia de cada opcin


Dificultad Discriminacin

Correlacin con la prueba

INDICE DE DIFICULTAD

Indica la proporcin de aciertos en la muestra de alumnos que estamos utilizando. Es la media de ste 50% de sujetos analizados. El trmino de dificultad se presta a equvocos: in ndice mayor indica un pregunta mas fcil. Este ndice de dificultad sirve para evaluar cuatro variables: La complejidad de la habilidad medida. Las caractersticas del logro del grupo. La comparacin de distintos reactivos que miden la misma habilidad. La comparacin de reactivos que miden la misma habilidad pero con una relacin jerrquica.

1. 2. 3. 4.

INDICE DE DIFICULTAD
Se fija un mnimo valor aceptable de p = 0.5 para considerar el reactivo bueno, cualquier medida inferior a 0.5, aunque no quiere decir que el reactivo no sirve, es mejor no usarlo porque podra ser que lo que est mal son las instrucciones.

Criterios para calificar la dificultad de los reactivos de acuerdo al valor del ndice de dificultad de los reactivos p.

Muy difcil 0% - 49%

Optima 50% - 69%

Ligeramente fcil 70% - 89%

Muy fcil 90% - 100%

INDICES DE DISCRIMINACION

Los ndices de discriminacin expresan en que medida cada pregunta o tem diferencia a los que mas saben de los que menos saben. Es el ndice probablemente ms utilizado. Expresa hasta que punto la pregunta discrimina, establece diferencias, contribuye a situar a un sujeto en el grupo superior e inferior. A mayor diferencia, en numero de acertantes entre los grupos superior e inferior, el tem es mas discriminante, contribuye mas a situar a un sujeto entre los primeros o entre los ltimos.

Las preguntas muy fciles y muy difciles no discriminan, no establecen diferencias; nos dicen
que todos saben o no saben una pregunta, pero no quien sabe mas y quien menos. Estas preguntas no contribuyen a la fiabilidad del test, pero eso no quiere decir necesariamente que sean malas preguntas.

Si todos y solos los del grupo superior responden correctamente, tendremos que: ID=1.
Si todos y solos los del grupo inferior responden correctamente, tendremos que: ID= -1.

Si el ID es menor de 0.30 el tem debe eliminarse porque no discrimina, an cuando su nivel de dificultad sea ptimo.

Si el tem tiene un ID igual o superior a 0.30 y su nivel de dificultad no es ptimo debe entonces corregirse y mejorarse ya que discrimina y puede considerarse como un tem adecuado para la prueba. A mayor valor, mayor poder discriminativo.

Forma de calcular D y P

1. 2.

Procedimiento: Hallar los puntajes totales por sujeto.


Ordenarlos de mayor a menor o al revs. Nos interesan los puntajes extremos (27% de bajos) y (27% de altos) y los puntajes promedio no sirven para el anlisis, se ocultan. Por ejemplo, si hay 100 datos el 27% serian 27 datos y si fueran 70 datos el 27% seria equivalente a 18 datos.

3.

4.

Calcular el nmero de sujetos del grupo de los altos que responde correctamente bien cada tem y calcular el nmero de sujetos del grupo de los bajos que responde bien cada tem. Identificar el ndice de dificultad por la formula: P = nG(altos)A + nG(bajos)B G(total)A + G(total)B y el ndice de dificultad con la formula: D = GA + GB G(total).

You might also like