You are on page 1of 53

Imagen

2
TEMARIO

Introducción a la materia ........................................................................................ 1


Batería de pruebas ................................................................................................................................ 1
Temario 1er Parcial ................................................................................................................................. 3

Instrumentos y Ponderación .................................................................................. 4


Pruebas .................................................................................................................................................... 4
Ponderación............................................................................................................................................ 4

Historia de las Pruebas Psicológicas ...................................................................... 5


Historia ...................................................................................................................................................... 5

Pruebas y Evaluación Psicológica ........................................................................... 7


Definición de prueba y Evaluación ..................................................................................................... 7
Herramientas de la evaluación psicológica ...................................................................................... 7
Herramientas de la Evaluación Psicológica ....................................................................................... 9
¿Quienes son las partes? ..................................................................................................................... 10

¿Qué implica una buena prueba? .......................................................................... 12


Puntos de vista ...................................................................................................................................... 12
Fuentes de referencia para información sobre pruebas ............................................................... 12
Elaboración de pruebas...................................................................................................................... 13
Validez.................................................................................................................................................... 20
Estandarización..................................................................................................................................... 25
Normas ................................................................................................................................................... 27

Clasificación de los Test ........................................................................................ 31

Aplicación de Test y Consideraciones Éticas ........................................................ 33


Propósitos y usos de los test................................................................................................................. 33
Administración de pruebas ................................................................................................................. 34
¿Dónde realizar las evaluaciones? y ¿Por qué? .............................................................................. 37
Ética y Normas de los Tests .................................................................................................................. 39

LA INTELIGENCIA Y SU MEDICION .................................................................... 43

Conclusión ........................................................................................................... 47
4
TEMARIO
Medición I – 2018 Mónica Vizcarra

Introducción a la materia
Lunes 5 de Febrero

En la parte teórica las pruebas que se van a aplicar van a tener que ver con
orientación vocacional, para que en un futuro sirva para la selección de personal.
Buscar Jóvenes que estén en la promoción sino en la pre promoción, idealmente en la
promoción.

Para cada prueba e instrumento a aplicar se necesita dos personas por cada
instrumento, puede ser uno de 5to otro de 6to, o dos de 5to no importa. No hay
exposiciones en esta materia, sin embargo como parte de apoyo se va a pedir que se
presenten algunos trabajos, en algunos momentos va haber dos o 3 actividades en
aula. Sin embargo va a ser grupal voy a hacer una calificación diferencial en la
medida que no se involucren todos.

Va haber una semana para aplicar el instrumento y realizar la presentación, una vez
explicado el instrumento.

Al final de semestre se presenta una carpeta, que es el seguimiento que se va


realizando a una misma persona, esos informes ya se los tiene corregidos a lo largo del
semestre, por tanto lo único a realizar es corregirlos, lo mínimo de pruebas que se
presentan en la carpeta son 3 pruebas así que se puede elegir entre los 6 instrumentos
que se ha aplicado.

El informe psicológico abarca un diagnostico entonces debe haber mínimo tres


pruebas. Finalmente hay que hacer un informe global. Todo va ser puntuado sobre 100
puntos, como se va a presentar 2 informes entonces van a ser puntuados sobre 50 pero
en el internet va a salir como una sola nota.

Miércoles 7 de Febrero

Batería de pruebas

Batería de pruebas conjunto de materiales que se seleccionan para buscar una


determinada respuesta a una situación. La demanda se va a traducir en el objetivo
que queremos lograr.
Para las diferentes pruebas debemos tener la habilidad de seleccionar las pruebas
frente a una demanda. Dentro de la necesidad puede o no que se aplique pruebas

Apuntes de Irene Muñoz 1


Medición – 2018 Mónica Vizcarra

cuales son las pertinentes para ese caso. Con la aura de los resultados de la batería se
encuentra que tiene porque y como vamos a lidiar con eso.

Cada prueba va valer 50 ya que son dos pruebas por carpeta. Dependen de la
prueba que se elija se le va a dar una prueba aplicada. A partir de los resultados se
hace la conversión cuantitativa el dx y pronostico. La finalidad del examen final es
tener la capacidad de poder entender lo que esta escrito en el informe sin haber
evaluado al niño y así poder hacer un diagnostico. Como va a ser puntuado sobre 100
se suma todo y se hace una regla de tres, para la habilitación se va sumar lo que se
tenga en el taller mas la teoria se suma, y se divide entre los dos, y de allí se da la
habilitación. La habilitación va a ser sumada al examen final.

En el examen final la docente da las carpetas en puntajes brutos, y nosotros debemos


trabajar convirtiendo los puntajes en la norma de las pruebas y haciendo el respectivo
informe global que implica análisis e interpretación de datos, impresión diagnostica y
pronostico.
Son dos examines finales, porque un día se presenta la carpeta de adolescente y el
otro la carpeta de niños.

Saber interpretar
Percentiles, puntajes Z, J normas de edad. Puntajes T. Este puntaje numérico es
acompañado con cualitativo.

2
Medición I – 2018 Mónica Vizcarra

Lunes 14 de Febrero

Temario 1er Parcial

1. Aplicacion de Test y Consideraciones Éticas:


• Propósitos y Usos de Tests
• Administración de pruebas
• Donde realizar las evaluaciones y ¿Porqué?

2. ¿Qué implica una buena prueba?


• Fuentes de Referencia para información sobre pruebas
• Elaboración de Pruebas
• Confiabilidad
• Coeficiente de confiabilidad
• Métodos para establecer la Confiabilidad
• Validez
• Coeficiente de validez
• Estandarización
• Tipos de Normas

3. Bibliografía
• Cualquier libro o texto que tiene que ver con medición en psicología, con pruebas
psicometrías, con evaluaciónn psicológica, con el nombre simplemente medición. T

Apuntes de Irene Muñoz 3


Medición – 2018 Mónica Vizcarra

Instrumentos y Ponderación

Pruebas
1. BAT 7 Batería de Aptitudes de TEA
2. Inventario de Hábitos de Estudio, Edición revisada y ampliada (I.H.E.) data del
2014
3. Intereses y Preferencias Profesionales - Revisado
4. Cuestionario de Personalidad para adolescentes (H.S.P.Q.), nos brinda una
informalcon complementaria. Esto es para una aplicación colectiva.
5. Escalas de Clima Social: FES (familia) para indagar sobre los aspectos familiares,
6. CES (en el centro escolar), su adaptación y desenvolvimiento, y como será en
un cambio diferentes cuando digamos vaya a la universidad

Ponderación

Integración de Contenidos y Conocimientos


4 Parciales 100 Pts cada uno
Presentación Escrita de Trabajos de Investigación
2 Presentaciones
- Ponderación Presentación Formal Escrita 10 Pts
- Contenido completo coherentemente organizado y específico
de acuerdo al tema a ser investigado 35 Pts

- Fuentes Bibliográficas 5 Pts


Presentación escrita del Informe Psicológico
- Informe Completo 5 Pts
- Análisis e Interpretación de Datos 25 Pts
- Diagnostico 10 Pts
- Pronostico y recomendaciones 10 Pts
Presentación de Carpeta
- Mínimo de pruebas 30 Pts
- Informe Global 30 Pts
- Diagnóstico 20 Pts
- Pronóstico 10 Pts
- Recomendaciones 10 Pts

4
Medición I – 2018 Mónica Vizcarra

Historia de las Pruebas Psicológicas

Historia
A finales del siglo 19 20,

• Test de Estandarizados de Aritmética, caligráfico, Lenguaje, caligrafía, Ortografía


• Primeros Test de Inteligencia Grupales Alfa Beta.
• Adaptación de la Prueba de Inteligencia de Binet para los EEUU Escala de
inteligencia Stanford Binet
• Primeros cuestionario de Personalidad Estandarizado
• “La hora de Datos Personales para los reclutas “La hoja de datos personales” para los
reclutas EEUU.

En China en el año 2200 antes de Cristo el gobierno chino sugirió una manera de
evaluar a los civiles, para ver si estaban capacitados para los roles, se la hacía cada 3
años pasaban esta evaluación para ver si eran aptos.

Sobre esta base europeos e ingleses agarran de ejemplo esta forma de evaluación
para hacer lo mismo en los ministerios públicos de sus países. La primera incursión de los
test psicometricos fue dado para determinar las diferencias de inteligencia y si las
capacidades de las personas estaban de acuerdo a los tipos de desempeño

• 1904, el ministro de educación pide a Binet - Simón elaborar una instrumento que
permitiera las diferencias de aquellos niños que no estaban al ritmo del comun de la
clase. Este instrumento debería servir porque algunos niños no podían seguir el ritmo del
comun.

• 1905 Simón Binet sacan la primera escala de inteligencia 30 test que median varios
aspectos de la inteligencia la característica principal es que esta escala media la
capacidad de juicio que tenían y la capacidad de razonamiento. Estaban en orden
de dificultad creciente.

• 1908 se da la primera revisión de esta escala, se sacan muchos ítems se amplia la


edad de 53 a 5 años, se crean items graduados por edad. A partir de su aplicación se
decide cuales sacar e implementan lo test graduados. A partir de esta revisión
aparece el término “edad mental” ma

Apuntes de Irene Muñoz 5


Medición – 2018 Mónica Vizcarra

• 1911 no hay mayor modificación, sino que se amplia a adultos bajo el mismo criterio
test diseñados para cada rango de edad. A partir de estas escalas se da mas apertura
a los test.

• El boom se da fechas coincidentes con la primera guerra mundial.

• Arthur Otis saca los primeros test de aplicación grupal, con la necesidad de evaluar
a los reclutas para la guerra. Se denomina test de inteligencia alfa y beta
◦ Alfa aquellos que leían y escribían y tenían cierto grado de instrucción
◦ Beta aquellos que no habían sido escolarizado los analfabetos y tambien
extranjeros. El beta no necesitaba respuestas verbales.

Adaptación de la Prueba de Inteligencia


• Lewis Terman hace modificación de las escalas, su fama cruzó las fronteras. Hace la
primera adaptación de las escalas, se la conoce como escala de inteligencia de
Stanford.

• Roberts Woodworth hoja de

A partir de esto se va publicando y revisando y ampliando estos instrumentos.

6
Medición I – 2018 Mónica Vizcarra

Pruebas y Evaluación Psicológica

Definición de prueba y Evaluación

Evaluación psicológica
1. Recopilación e integración de datos relacionados con la psicologia, con el
propósito de hacer una evaluación psicológica lograda con el uso de herramientas.
2. Valorar la presencia de una o más características personales.
Un conjunto de herramientas que me va permitir recopilar los datos.

Prueba psicológica
1. Procedimiento de medición de variables relacionadas con las psicologías por medio
de dispositivos o procedimientos diseñados para obtener una muestra de
comportamiento (muestra de estandarización una cantidad grande personas que son
representativos del total de la población
Toda prueba de medición tiene un grupo de estandarización
Grupo de estandarización representativo del total de la población y el resultado es
particular. Por eso tiene tablas x cantidad de personas grupo de estandarización.

Test cualquiera instrumento que se utiliza para evaluar el comportamiento o


desempeño del individuo.

El proceso de evaluación es una parte nuestro trabajo no se termina con

Herramientas de la evaluación psicológica

• Prueba:
• Entrevista
• Portafolio
• Datos en la historia clínica
• Observación conductual
• Las computadoras como herramientas; el instrumento te trae el paquete y el
programa te lo corrige la desventaja es que tiene un costo adicional y una cantidad
limitada.

Apuntes de Irene Muñoz 7


Medición – 2018 Mónica Vizcarra

• procedimiento de medición diseñada para medir variable relacionadas on la


psicología como inteligencia, personalidad, aptitudes

Características de la prueba

Contenido: Toda prueba tiene un titulo y en ese título ya puedo saber de que se rata o
que mide, para qu esta diseñada la prueba toda prueba esta diseñada para algo en
particular y que paralelamente me da información complementaria. Determinar la
edad madurativa.

Formato: se relaciona con la estrcutura y disposición de los reactivos de la prueba y los


limites de tiempo. Toda prueba tiene una estructura interna que la va a caracterizar.

Procedimiento de administración
Leerla y tenerla a nuestro lad ara leer la cnsigna a medida que lo aplico.

Se debe administrar los las secuencias de los pasos a ser tomados en cuenta de
acuerdo a la naturaleza de la prueba y a lo que pretende medir

Procedimiento de calificación e interpretación


Las pautas que damos a cada prueba es el puntaje bruto lo denominamos puntaje a
lo que ha hecho. Te ha respondido
Cuando se convierte en la norma con la que se maneja la prueba. Comparar edad
cronológica con la edad mental.
El puntaje bruto natural me sirve para la conversación de la norma

Interpretación cuantitativa es indispensable sino no sirve

Calidad de calificación e interpretación


Aquí nos habla de confiabilidad
1. la parte psicometricas donde nos da la historia técnica de la prueba que criterios
para la stadarizacion
2. Consignas
3. Tablas
4. Manuales ejecuciones

8
Medición I – 2018 Mónica Vizcarra

Herramientas de la Evaluación Psicológica


Toda prueba tiene un titulo y en este dice que mide va a depender de la prueba que
en su contenido sea único y particular y nos de una información complementaria.
Paralelamente al objetivo principal de la prueba tenemos
El contenido tiene una difectriz pero no es único sino nos da aspectos de coplemtenso
de información.
Cada tes tiene sus propios ítems.

Todo test psicometricas tiene una prueba, el analisis da información a esos diferentes
aspectos.

Los manuales de test psicometricas nos da todo hecho, solo debemos leerlos y
seguirlos.
Bajo ningún criterio asumimos que va a entender y por ende se le cambia las palabras
estamos en la obligaico para tener una buena y correcta aplicación del contexto, al
ser standarizados son validados entonces hay confiabilidad entonces nos asegura que
los resultados que obtengas son confiables.

Sin embargo se han hecho en otro medio por tanto, hay que hacer una. adaptación,
pero se hace este cambio a traes de un proceso en una validación de expertos, se
hace un acuerdo en la validación de expertos, allí se llega a un acuerdo.

Entrevista

Es otra herramienta usada ampliamente en el proceso de evaluacion, esta entrevista


como herramienta en la psicología implica mas que una charla, es un método de
recopilar información por medio de la recopilación reciproca directa.

Hay diferentes tipos de entrevista dependiendo la información que se desee recabar,


el propósito y objetivo que se tenga acerca de la misma ej:
• evaluacion clinica
• Evaluación para empleo
• Evaluación para admisión, etc.

Apuntes de Irene Muñoz 9


Medición – 2018 Mónica Vizcarra

Antes de la aplicación de pruebas hay que realizar la entrevista si es menor de edad


con los padres. Ya que la entrevosta ya nos da pautas y para seleccionar. La batería
d epruebas se la arma conforme a la necesidad.

Portafolio
• Muestra de trabajo muy usada de la perspectiva de los administradores educativos.
• Seguimiento de casos a lo largo de un determinado tiempo.

Datos en la Historia clinica


• Conocido tambien como anamnesis se refiere a registros, transcripciones hechas por
escrito que contienen antecedentes y detalles elegantes para un evaluado.
• Los psicólogos escolares y clínicos se basan en los datos de la historia clinica para
responder preguntas respecto al curso de la historia de desarrollo de un individuo.

Observación conductual
• Esta puede ser directa donde se observa el comportamiento de la persona en
diferentes momentos e instancias es un procedimiento muy utilizado en la evaluacion
clinica
• Es un procedimiento muy utilizado en particular en instituciones como escuelas,
hospitales, prisiones y hogares.
• Los profesionales privados no tienen acceso a hacer uso de esta herramienta.

Computadora como herramienta


 Nos hacen referencia a que las pruebas además de irse actualizándose han ido
incorporando elementos o herramientas relacionadas con la computación que
ayuden a la calificación de los instrumentos que se van a aplicar, directamente
metes ciertos datos. Automáticamente te califica la prueba.
 Son utilizadas como medio de calificación y conversión de datos obtenidos en
relación con las pruebas
 Ventaja econocimia de tiempo de los evaluadores. Tiene un costo Adicional, los
cotos no son precisamente accesibles son medianamente altos, no es de uso
ilimitado.

¿Quienes son las partes?

10
Medición I – 2018 Mónica Vizcarra

• Elaborador de la prueba
Son los que crean las pruebas u otros tipo de evaluacion, la APÁ estima mas de 20.000
pruebas psicológicas nuevas se elaboran cada año.

• El usuario de la prueba
Las pruebas son empleadas por una amplia variedad de profesionales incluyendo
psicólogos clínicos, orientadores, personal RRHH, profesores y otro tipo de personal
especializado. Los principios de la ética profesional debe regir la aplicación e
interpretación de los diferentes instrumentos.
No todas las personas tienen acceso a este tipo de pruebas.

• El que responde la prueba


Son las personas a las que se le aplica la prueba, estos enfocan las situaciones de
evaluación de diferentes formas, y los evaluadores debe ser sensibles a la diversidad
de la respuestas posibles.

Apuntes de Irene Muñoz 11


Medición – 2018 Mónica Vizcarra

¿Qué implica una buena prueba?

Puntos de vista
Hay dos puntos de vista a tomar en cuenta para catalogar a una buena prueba:
• Lógico
• Técnicos

Lógico
Desde el punto de vista lógico los criterios para una buena prueba incluye:
 Instrucciones claras para su aplicación
 Instrucciones claras para su calificación: todo instrumento psicometricas te
especifica los criterios de calificación
 Instrucciones claras para su Interpretación.
Y también si una prueba ofrece economía en el Tiempo para ejecutar estos procesos.

Evaluamos para saber cómo está el niño, una batería de pruebas nos lleva a tener un
diagnostico amplio y saber cual va a ser el camino.

Técnicos

Existen criterios técnicos que usan los profesionales de la Evaluación para estimar la
calidad de las pruebas.
Estas consideraciones técnicas tienen que ver con la PSICOMETRÍA que se la define
como:
La ciencia de la medición psicológica que permite analizar tres aspectos
fundamentales de cada prueba:
 Confiabilidad: Precisión y consistencia de lo que. mide la prueba
 Validez : Indica sí una prueba mide lo que pretende medir
 Proceso de Estandarización: Obtención de normas muestra población conjunto
de personas que se considera representativa para medir lo que dice que la
prueba mide.

Fuentes de referencia para información sobre pruebas

12
Medición I – 2018 Mónica Vizcarra

Existen muchas fuentes de referencia para aprender mas sobre pruebas como:
 Catálogos de Pruebas: son generalmente proporcionados por las editoriales,
generalmente no tiene mucho detalle, nos da un listado del material y tal ves
algún otro detalle. La finalidad del catalogo es vender las pruebas.
Es una de las fuentes mas accesibles, por lo general, es distribuido por el editor de la
prueba, por lo general solo contiene una descripción breve de la prueba, y rara
vez información técnica detallada.

 Manuales de prueba: proporcionan información detallada concerniente a la


elaboración de la prueba proporcionan información psicométricas muestra
normativa, confiabilidad, validez.

 Articulo de revistas especializadas: proporcionan información sobre el uso y


resultado de distintas pruebas así se tiene:
o Revista psicológica educativa
o Revista psicologia social
o Medición educativa y psicológica

 APA

La información obtenida de esas fuentes puede ser de gran utilidad para seleccionar
instrumentos entre los muchos disponibles, especialmente para asegurarse si los
objetivos de la prueba se ajusta a la evaluación que se necesita.

 Base de datos en línea


Las computadoras no solo han revolucionado la forma en que se aplican e interpretan
muchas pruebas, sino que han revolucionado la forma en que se recopila la
información relacionada con la evaluacion por ejemplo la base de datos de la APÁ
diseñada para ayudar a localizar documentos relevantes.

Elaboración de pruebas

El proceso de elaboración ocurre en 5 etapas: concebir la prueba como respuesta en


dominio nuevo

1. Conceptualización de la Prueba concebir la idea para una prueba nueva


como respuesta a la necesidad de medir un dominio nuevo
2. Construcción de la Prueba Preparar reactivos items o preguntas de la prueba
en función del Constructo.

Apuntes de Irene Muñoz 13


Medición – 2018 Mónica Vizcarra

3. Ensayo de la prueba Los items que forman parte de la prueba se ensayan en


una muestra de sujetos que la responden. teniendo cuidado que si la prueba va
de los tres a cinco años, la cantidad debería ser medianamente equilibrada
dependiendo el rango de edad. A partir de esto debo analizar esos reactivos.
4. Análisis reactivos se analizan los resultados del ensayo con el propósito de hacer
juicios respecto a cuales reactivos son buenos tales como están cuales deben o
necesitan ser revisados y cuales deberían descartarse. con el propósito de
hacer juicios, de acuerdo a esto puede ser que este bien o no o puede ser que
en función de esta análisis tenga que volver a aplicar la prueba, cuando vuelvo
a aplicar la prueba la evaluación debe ser distinta. El paso entre tres y el cuatro
puede repetirse varias veces, hasta que sea optimo. Para ver si los ítems están
bien o no, no solo se analiza a partir de la parte cualitativa, si mi coeficiente es
bajo aunque mi análisis cualitativo es optimo no vale igual son esos criterios que
me llevan a revisar.
Para esto se emplean procedimientos. Se llega cuando veo que a partir de mi
confiabilidad. Puede haber n cantidad de borradores hasta llegar al nivel
optimo.
5. Revisión de la prueba: se crea un segundo borrador de la prueba con base en
el analisis de los reactivos y se ensayan nuevamente en una muestra nueva de
personas que la responderán y cuyos resultados se analizaran.

Una vez que se considero que la prueba de respuesta a aquello para lo que ha sido
creada se procede a verificar su confiabilidad. Toda prueba psicometricas debe pasar
por esto.

CONFIABILIDAD (parte mas árida)

Para que un instrumento tenga valor se considere valido, confiable es necesario


que mida algo de manera consistente o confiable, es decir , que la prueba nos dé
resultados en los que podamos confiar. A partir de estos parámetros cuantitativos que
nos va a dar en algún momento si alguien pusiera en duda el argumento, si
conocemos los datos se puede defender.

Por ejemplo ¿Porque considera que este instrumentos tiene que ser empleado en este
caso no en otro? Podríamos responder entre los varios datos que me median esto tuvo
mayores datos de confiabilidad. El dato cuantitativo me garantiza que mi prueba es
confiable.

14
Medición I – 2018 Mónica Vizcarra

Parámetros de confiabilidad
Una prueba es confiable si:
 En ausencia de cambios permanentes en la persona como el factor
crecimiento aprendizaje, enfermedad o accidentes. Los resultados o puntajes
no varían con el tiempo en distintas situaciones. La prueba puede ser aplicada
n veces. Una prueba que se considera confiable no va a tener esa variación.
Esto supone que estamos midiendo una característica relativamente estable de la
persona.

El establecimiento de la confiabilidad supone el análisis de los efectos de las


condiciones de aplicación en los puntajes que obtiene una persona. No se asume
nada en el manual en todo caso. Nos regimos a esos criterios específicos de la prueba,
se refiere al establecimiento.

Lo que yo recibo por parte de la persona espero recibir. Nosotros nos regimos por el
manual. Todo tiene su consecuencia pero hay que tener en cuenta que hablamos de
la persona.

Se sabe entonces que va a ocurrir pequeñas variaciones en los puntajes en los


resultados debido a:
 Estados internos temporales o Baja motivación o
 Condiciones extras insatisfactoria
A estas variaciones se las denomina ERROR NO SISTEMÁTICO DE MEDIDA.

En la teoria de las pruebas se supone que la calificación o puntaje que obtiene una
persona en una prueba se compone de una “Calificación Real” más algún Error n
Sistemático de Medida.

La calificación real se defina como el promedio de las calificaciones que se


obtendrían si una personas presentara la prueba una cantidad infinita de veces.

La Calificación Real nunca puede medirse con exactitud sino que se calcula a partir
de la calificación obtenida por la persona en la prueba, por eso se defina como el
promedio de las calificaciones.

Coeficiente de confiabilidad
La confiabilidad de una prueba se expresa como un número decimal positivo que va
desde:
.00 hasta 1,00

Apuntes de Irene Muñoz 15


Medición – 2018 Mónica Vizcarra

Este número al expresa una correlación entre puntajes (r) donde:


R=1.00 indica una confiabilidad perfecta
R= .00 indica falta total de confiabilidad
Un coeficiente optimo esta alrededor de 0.85 en cualquier tipo de prueba aunque por
lo general los coeficientes con más bajas en las pruebas en las pruebas afectivas que
en las cognoscitivas. HSPQ

Estas pruebas afectivas en relación con las psicometricas

Por encima del 0.85 nos da mayor confianza en el instrumento.

En las pruebas de aptitud se consideraría bajo un coeficiente de 0,26 es bajo; 0,88 es


medio; 0,96 es alto.
Estoy haciendo mediciones de aspectos puntuales y específicos.

Formas para establecer confiabilidad

Existen tres formas o métodos para establecer la Confiabilidad de una Prueba


1. Test - re Test
2. Pruebas paralelas o Equivalentes
3. Partición o División en Mitades

1. Test - re Test
 Este método consiste en aplicar dos veces la misma prueba para conocer si en
distintas ocasiones el instrumento no fa el mismo puntaje para la persona.
 Hay excepción cuando se hace una intervención este procedimiento toma en
cuenta las diferencias en los puntajes errores de medida que pueden deberse a las
condiciones de aplicación de la prueba cambien etc. En ambas ocasiones.

La información que nos reporta este método o procedimiento tiene que ver con
la Estabilidad Temporal de los Puntajes y estadísticamente con un Coeficiente de
Estabilidad correlación test retest.

Cuando el intervalo de tiempo entre las dos aplicaciones es breve es decir de días o
semanas las correlación test re test debería ser mayor por lo tanto la confiabilidad
también es mayor.

16
Medición I – 2018 Mónica Vizcarra

Si el tiempo entre prueba y prueba es prolongado MÁS DE SEIS MESES las diferencias
son mayores y estas NO se deben a las condiciones de aplicación sino a CAMBIOS
DURADEROS EN LA PERSONA maduración aprendizaje etc.

Para que este método sea adecuadamete utilizado el tiempo de esta prueba no
debe ser mayor a los seis meses

En pruebas para niños pequeños en los posible no debe pasar de los 2 meses ya que el
nivel de desarrollo en los niños es muy rápido.

Esta modalidad presenta la dificultad de que los evaluados puedan recordar las
respuestas o aprenderlas sobre todo si la segunda aplicación es en muy breve tiempo.
Esta modalidad informa solamente acerca de la Estabilidad Temporal de las
Puntuaciones.

Casi siempre algunas personas evaluados evaluadas recuerdan mas respuestas que
otras reduciendo la correlación entre la primera y segunda aplicación no existiría
problema sus todos recordaran igual cantidad de respuestas lo que se necesita
entonces para este error es:

2. Formas paralelas o Equivalentes:

Crear una forma paralela de la prueba es decir una prueba que consista en preguntas
similares pero NO IGUALES
Al aplicar una forma paralela después de un intervalo apropiado de tiempo puede
calcularse un coeficiente de confiabilidad que muestra los errores en la medida que
pueden deberse a las condiciones de aplicación
La correlación que resulta se conoce como coeficiente de Estabilidad y Equivalencia.

Para poder diferenciar claramente el efecto que produce este método se sugiere
dividir al grupo normativo en dos partes:

Primera aplicación:
- A la primera mitad del grupo se le aplica la forma A
- A la segunda mitad del grupo se le aplica la forma B

Segunda aplicación:
- A la primera mitad se le aplica la forma B
- A la segunda mitad se le aplica la forma A
La estandarización se trabaja con el grupo normativo

Apuntes de Irene Muñoz 17


Medición – 2018 Mónica Vizcarra

Las formas paralelas de una prueba son equivalentes porque confieren la misma clase
de preguntas y de igual dificultad por lo tanto los resultados que se obtienen con una
forma de prueba (A) son muy similares a aquellos que se obtienen con una segunda
forma (B). Esta forma se aplica a las mismas personas, en el mismo nivel de edad o
grado.
La desventaja es que la elaboracion de dos pruebas (paralelas) es una proceso
costoso además lleva tiempo pues deben tener las mismas clases y cantidad de
reactivos y tambien debe aplicarse al mism grupo de personas.

División en Mitades;

Dado que elaborar formas paralelas es muy costoso se desarrollo un método para
conocer la confiabilidad de consistencia interna que contempla los errores no
sistemáticos de medida.
Este método consiste en conceptualización una prueba como si consistiera en dos
partes, cada una de las cuales mide lo mismo de esta manera se puede obtener dos
puntajes separados de cada sujeto.
Los mas conveniente es dividir las prueba en pares e impares y la correlación entre
ambos es un Coeficiente de Confiabilidad que tienen medias y varianzas iguales.

Una recomendación es aplicar las dos mitades de la prueba en momentos distintos


pero con limites de tiempo iguales.

El calculo de la correlación se hace por medio de la formula Spearman Brown.

Si bien la modalidad de items pares e impares es la más frecuente para conocer la


confiabilidad a través de este método existen otras dos modalidades matemáticas
para calcular la correlación:
 Método Kuder Richardson calcula el promedio de los coeficientes de
confiabilidad obtenidos de todas las divisiones a la mitad como el calculo de
confiabilidad general este calculo se lo realiza mediante la formula Kude
 Coeficiente Alfa: es otro método para calcular la confiabilidad para aquellos
instrumentos cuyos reactivos tienen dos o mas valores.

Confiabilidad entre calificadores


Tiene que ver con los expertos que dan credibilidad a este, se trata de
objetividad, dos calificaciones distintas tenían que ser diferentes. Además de esto se
toma los criterios sobre los cuales se van a hacer las calificaciones. Objetivos nos
referimos a que sean claras y distintas, esto quiere decir que los. Criterios de

18
Medición I – 2018 Mónica Vizcarra

calificación y de aplicación deberían ser tan claros que si lo siguen siendo diferentes.
Administración y puntuación.

Se espera que la calificación entre dos calificadores sean iguales.


“Cuando se trata de pruebas objetivas se supone que las calificaciones que calculan
dos calificadores distintos serán idénticos, aunque algunas veces, sobre todo si las
instrucciones de los instrumentos dan lugar a cierto margen de subjetividad esto puede
no ocurrir”
“Para determinar la confiabilidad entre calificadores el método mas común que se
utiliza es:
 Hacer que dos personas califiquen las respuestas de una cantidad considerable
de sujetos y después calcular la correlacion entre los dos grupos de
calificaciones.
 Otra modalidad es hacer a la inversa que varias personas califiquen las
respuestas a la prueba de un sujeto.
 Hacer que varias personas califiquen las respuesta la prueba de varios sujetos
esto da como resultado un coeficiente de concordancia que es una
coeficiente de confiabilidad entre calificadores generalizado”
Debemos llegar al mismo resultado, ESTE ultimo es el mas utilizado ya que son varios,
estos criterios son tan específicos que los siguen cualquiera debería obtener resultados
confiables.
“La confiabilidad de una prueba va a depender del numero de reactivos que la
componen: mientras mas extensa sea la prueba mayores niveles de confiabilidad se
obtendrán.
También depende de la heterogeneidades grupo de personas que la realiza
cuanto mas amplio sea el rango de diferencias individuales en una característica
determinada mayor será la Varianza de calificaciones en una medida de esa
característica como consecuencia el coeficiente de confiabilidad de una prueba y
otro instrumento de evaluación será mayor en una grupo heterogéneo.”
Cuanta mas amplia y variables me aseguro que es la población es
representativa, y la confiabilidad mas alta.

“En la practica se refleja el hecho de que los manuales pueden reportar distintos
coeficientes de confiabilidad para los grupos por edades, grados, sexo y nivel
socioeconómico.”
Esto nos lleva a utilizar mas de uno de los métodos de confiabilidad.

Apuntes de Irene Muñoz 19


Medición – 2018 Mónica Vizcarra

Validez

Se define validez como el grado en el cual la prueba mide aquello para lo que se
diseño
Una prueba puede tener muchos tipos de validez dependiendo de los propósitos
específicos con los que se diseño, la población a la que se dirige y el método para
determinar la validez.
Entre los métodos mediante los cuales se puede evaluar la validez están:
1. Validez de Contenido o análisis de contenido: Determinar que los reactivos
están relacionados con lo que dice, que los ítems o reactivos que me van a
medir determinadas cosas me lleven a lo que me tiene que medir elementos
que hacen a las funciones básicas, aquello que le voy a pedir me tiene que dar
por objetivo.
2. Validez de criterio la prueba debe estar en relación a lo particular
3. Validez de constructo o validez de construcción - investigación de las
características psicológicas o constructos particulares que mide la prueba.

Validez vs confiabilidad
La confiabilidad es una condición necesaria pero no suficiente para la validez: una
prueba puede ser confiable pero no ser valida, pero no puede ser valida si no es
confiable.

a)Validez de Contenido
Se refiere a si el contenido de la prueba produce un rango de respuestas que
representa un área o universo de habilidades o comportamientos que se supone que
la prueba debe medir. Ese universo o área se debe especificar con detenimiento.

Es decir aquello que pretenda medir tiene considerar aspectos que sean
representativos de la población meta, no solamente al grupo al que estoy aplicando
la prueba sino para que también lo investigadla pueda ser aplicado. Hablamos de
ares comportamientos. Se establece la consigna para esa consigna hay cierto tipo de
respuestas cierto tipo de conducta comportamientos etc. Tengo que esperar que esto
pueda ser replicado a otra población y que las respuestas sean parecidas.

20
Medición I – 2018 Mónica Vizcarra

Si la prueba esta bien diseñada las respuesta que dan los sujetos serán
representaciones de los que darían el universo de situaciones de las que la prueba es
una muestra, Representativo de una población meta.

Esta validez se realiza a través de:


 Juicio de expertos, los expertos realizan juicios sobre que reactivos incluir desde
el inicio de la elaboración de la prueba. si os expertos determinan que la
prueba parece y funciona como una medida de la habilidad o conocimiento
que se supone debe evaluar se dice que posee validez de contenido.

 Análisis de los procesos por los que deben pasar los sujetos a fin de llegar a las
respuestas. que proceso esta implícito?

Por ejemplo si como parte del reactivo te pide que hacer que procesos están en la
actividad de recortar, dentro de la motricidad, la coordinación viso motora, ara cortar
necesitas motricidad fina dentro una buena coordinación viso motora. o lees na
historia y pides que te la repita aquí esta comprensión memoria a corto plazo niveles
de atención etc. esto de los procesos lleva a hacer el análisis cuantitativo.

Determinar que procesos están inmersos en cada uno de los reactivos que uno
pretenda medir, estos deben estar relacionados con lo que se supone que mide la
prueba.

 Sobre el Universo: el universo del contenido en la prueba y la muestra de ese


universo.

Es decir que tan representativo va a ser de una población meta que esta en relación
de los rangos de edad. Cuando hablamos de universo hablamos de una gran
cantidad de personas que a su vez vana estar restringidas al rango de edad.
Mi universos no va a ser todos los niños sino aquellos que están entre 4 a 6 años a ese
rango de edad esta dirigida la prueba

Universo= el total de población dentro los márgenes que ha sido diseñada la prueba.

Dentro de la calificaion de los problemas los exámenes forman parte

- El análisis de validez de contenido se utiliza con mas frecuencia para evaluar el


aprovechamiento y también las pruebas de aptitud intereses y personalidad.

Apuntes de Irene Muñoz 21


Medición – 2018 Mónica Vizcarra

Cuando hablamos de aprovechamiento también estamos hablando de examenes


parciales controles.

En el caso de las pruebas de aprovechamiento además del juicio de expertos, se


utiliza un cuadro de especificaciones respecto de los contenidos que supuestamente
cubre la prueba.

Quiere decir que cuando yo quiero asegurarme, no todos los hacen, cuando yo voy a
hacer un examen quiero asegurarme que esta bien elaborado y tenga validez de
contenido voy a expertos en ese tema y área, y acompaño mi preguntas con un
contenido de especificaciones, es decir todas estas preguntas se desprenden de estos
temas que a su vez abarcan estas cosas. El contenido de especificación es el que
avala que tu pregunta este bien formulada.

También el instrumento debe parecerle a las personas como un contenido valido con
respecto a sus propósitos particulares para que se sientan motivados a responder esto
se llama :

Validez Aparente: Si la prueba no tiene validez aparente probablemente la prueba


tienda a dejar de ser comercializada y utilizada.

Para que se entienda si se han preparado en este tema y les paso un parcial donde
tienen que resolver aspectos de ley 070, que tiene que ver esto con la validez de
contenido cuando me esta preguntando para otras cosas, que no me he preparado.
Este instrumento debe dar la impresión que es valido con respecto a lo que se ha
preparado con respecto a lo que se espera que les pregunte.

b) Validez con relación a criterio

Todas las pruebas se validan al relacionar los puntajes o calificaciones en la prueba


con el desempeño de los sujetos en las medidas de criterio o medidas con las que
pueda compararse el desempeño en una prueba.

Quiere decir Las respuestas deben ser coherentes al puntaje que vaya a obtener, o
viceversa el puntaje que pretendo dar para cada tipo de respuesta debe ser
coherente a lo que se espera. Todas las pruebas se validan al relacionar los puntajes
con el desempeño de los sujetos en las medidas del criterio con las que se pueda
comparar.

22
Medición I – 2018 Mónica Vizcarra

Por ejemplo una criterio es el puntaje de habilitación que es 60 y la aprobación es 51.


Los criterios deben tener coherencia.

Estas medidas de criterio pueden ser calificaciones escolares, de la universidad,


calificaciones u otras medidas conductual es o mentales de instrumentos ya probados

Cuando hablamos de calificaciones por ejemplo en un abc vamos a tener una


calificación superior, que nos dice que el niño va a aprender a leer y a escribir en un
proceso de seis meses, una calificación media que nos dice que el niño optara al
aprendizaje de la lecto escritura a los largo del año, una calificación inferior que me
dice que el niño va a necesitar apoyo. A eso se refiere se hace una calificación por
grado superior medio y bajo, cada una me representa algo.

Siempre que una medida de criterio esta disponible en el momento de la prueba se


determina la validez concurrente de esta, que este disponible en el momento de la
prueba quiere decir que cuando uno sabe que cada pregunta va valer 10 puntos.
La validez concurrente hace parte de la validez con relación a criterio, los
procedimientos se utilizan siempre que una prueba se aplique a personas de distintas
categorías

 Validez concurrente: los procedimientos de validez concurrente se utilizan siempre


que una prueba se aplica a persona en distintas categorías grupos de diagnóstico
o niveles socioeconómicos, con el propósito de determinar si las calificaciones
promedio en distintos tipos de personas o con distintas características son o no
diferentes en manera significativa
◦ más heterogéneas mas diferencias voy a tener.

Cuando las calificaciones con base en el criterio no se encuentran disponibles sino


hasta tiempo después de aplicada la prueba se llama validez de predicción. Estoy
prediciendo.
Por ejemplo en una prueba de aptitud.

 Validez predictiva: se refiere al grado de precisión con que las calificaciones de la


prueba predicen las calificaciones de criterio.
La validez predictiva se ocupa en primer lugar de las pruebas de aptitud o inteligencia
que predicen "rendimientos" futuros.
La dificultad que aparece muchas veces el encontrar el criterio adecuado para la
valoración.

Apuntes de Irene Muñoz 23


Medición – 2018 Mónica Vizcarra

Factores de afectación

La validez en relación a criterio de una prueba puede ser afectada por varios factores:
1. Contaminación de criterio, en ocasiones el criterio se hace menos valido o se
"contamina" por falta de pericia que tiene la persona que evalúa; de prejuicios,
es decir, que se debe ofrecer a cada persona la misma oportunidad de obtener
una calificción buena.
2. Extensión de la prueba, al igual que en la contabilidad, la validez varia en forma
directa con la extension de la prueba y la heterogeneidad del grupo de
personas, siendo estas más alta pues tienen una mayor amplitud para efectuar
predicciones más seguras.
a. Por otra parte, las calificaciones obtenidas en pruebas cortas o breves o
en aquellas que se aplican a grupos de personas más homogéneas.
3. Diferencias de Grupos, las características del grupo s de personas para quienes
es válida una prueba incluyen variables como sexo, edad, rasgos de
personalidad.

Para hacer que la prueba sea valida en grupos amplios de personas debe probarse en
distintos grupos, de este modo se asegura la validez a este tipo de validez se la
denomina validez cruzada.

c) Validez de Constructo
Se refiere al grado en el cual el instrumento es una medida de un constructo en
particular o, concepto psicológico.

Para determinar esta validez, se utilizan un conjunto de procedimientos como:


 Juicio de expertos, de que el contenido de la prueba corresponde al constructo
de interés
 Correlación de la prueba con otras pruebas, y variables con las que se espera
que la prueba tenga relación.
 Interrogar a los evaluados y Evaluados, con el objeto de determinar los procesos
mentales específicos que tuvieron lugar al decidir dar esas respuestas.
 Demostraciones experimentales, los instrumentos con validez de constructo
deben tener correlaciones altas con otras medidas del mismo constructo
(validez congruente) y correlaciones bajas con las medidas de constructos
diferentes (validez discriminante)

Coeficiente de validez: la validez desde el punto de vista numérico, también se


expresa con un coeficiente de correlación que debe ser mayor a 0, cuanto más alto,
más seguros estamos de la validez de un instrumento.

24
Medición I – 2018 Mónica Vizcarra

Estandarización

Es el proceso de aplicar una prueba elaborada con detalle a una muestra extensa y
representativa de personas en condiciones iguales o estándares, con el propósito de
elaborar normas.

Normas: datos de desempeño de un grupo particular de personas que están


diseñadas para su uso, como referencia para interpretar puntuaciones.
Cualquier prueba estandarizada, tiene instrucciones estandarizadas para su
aplicación y calificación, que deben seguirse estrictamente.

La estandarización de cualquier instrumento de evaluación psicológica requiere


de la aplicación de una extensa muestra de individuos (muestra de estandarización o
grupo normativo) que se seleccionan como representativos de la población meta para
la que se elabora.
Las normas se elaboran a partir de los puntajes brutos o directos que se obtienen de la
aplicación de la prueba.
Una vez que se convierten los puntajes brutos a los de normas es ese resultado
(percentil) es lo que se interpreta y NO el puntaje bruto.

En el análisis se tiene que ir a las funciones de base, esos puntajes brutos se transforman
en NORMAS.

Las NORMAS son los DATOS DE DESEMPEÑO en la prueba de una grupo particular de
personas.
Las normas sirven para interpretar los puntajes brutos de las personas a las que
se aplica la prueba; posteriormente los puntajes que obtenga la persona indicaran su
desempeño con respecto a la muestra. La norma me permite decir si hay retraso
adelanto o no.

Para considerar adecuadas las normas en:


- • PRUEBAS INDIVIDUALES: El número de personas debe estar entre 2.000 y 4.000
- • PRUEBAS GRUPALES: por lo menos 10.000 personas.

Sin embargo contar con una muestra grande por la simple cantidad NO Garantiza
que sea representativa, la muestra debe ser seleccionada con detenimiento, tener
cuidado con las características.

La forma como se elige una muestra varia desde el Muestreo Aleatorio Sencillo hasta
estrategias de muestreo más complejas como el Muestreo Estratificado.

Apuntes de Irene Muñoz 25


Medición – 2018 Mónica Vizcarra

Muestreo Aleatorio Simple o Sencillo:


Cada persona en la población tiene la misma oportunidad para ser seleccionada, sin
embargo la aleatoriedad NO asegura la representatividad, entonces... Una forma más
apropiada de estandarizar una prueba es empezar a "Estratificar" la población.

Muestreo Estratificado:
Se toman en cuenta una serie de variables demográficas como: sexo, edad, nivel
socio económico, región geográfica, etc. Que se supone se relacionan con las
calificaciones que se obtienen en las pruebas. Se elige en proporción a la población
de ese estrato.
Con el uso de Muestreo Aleatorio Estratificado se reduce al mínimo la probabilidaddad
el seleccionar una muestra No representativa, y las normas por tanto tendrán una base
más firme.
De esta manera la cantidad de personas que se eligen para cada categoría o estrato
se hace proporcional a la cantidad total de personas en la población meta que
pertenece a ese estrato.

Se debe tomar en cuenta el muestreo aleatorio estratificado puede ser muy costoso,
entonces más económico resulte el:

Muestreo de Grupos:
Consiste en dividir una población determinada en áreas geográficas u otras unidades
relevantes en bloques o grupos.
Como el procedimiento de aplicar una prueba entera a una muestra grande es
muy costoso se a optado en ocasiones a realizar:

Muestras de Reactivos:
Diferentes muestras de reactivos se aplican a sujetos diferentes que se eligen de
manera aleatoria, de modo que un conjunto de reactivos y otros grupos responden a
otros. Las Normas resultantes son muy similares a aquellas obtenidas mediante el
procedimiento tradicional.

Las normas que se utilicen para la interpretación de las calificaciones deben ser
apropiadas para el grupo o sujetos que se evalúa, para ello es importante tener en
cuenta la naturaleza del grupo normativo: edad, sexo, nivel socioecónomico, etc. y
tenerla en cuenta también en la interpretación.

26
Medición I – 2018 Mónica Vizcarra

Otro factor importante a considerar es el momento en que se obtienen las


normas “cuando” pues si se han producido cambios educativos o sociales muy rápidos
las Normas pueden volverse obsoletas.

Normas

TIPOS DE NORMAS
• Normas de Edad
Están entre los tipos más populares de Normas porque se entienden con facilidad.
Una Norma de Edad es la calificación mediana que obtienen en una prueba los
sujetos de una edad cronológica determinada, por ejemplo: Edad Madurativa, Edad
Social, Edad Perceptiva, etc.

MEDIANA calificación en una distribución de Calificaciones por encima y por debajo


de la cual caen el 50 % de las calificaciones

Las normas de edad se expresan en años y 12 intervalos de 1 mes, por ejemplo:


10 años 0 meses.

La desventaja que presenta es que este tipo de Normas supone que la tasa de
incremento de las diferentes funciones psicológicas es constante, como las funciones
cognitivas, psicomotrices y afectivas.
Poresta razón se prefiere Normas donde la unidad de medida es menos
variable.

Normas de Edad Mental


Es un tipo de Norma de Edad que se utiliza en distintos tipos de pruebas de
inteligencia. La edad Mental de un sujeto en particular corresponde a la Edad
Cronológica cuya calificación promedio es igual a la calificación del sujeto.
En muchos lugares se la utiliza para formar grupos con propósito de enseñanza.
Cocientes: EM / EC x 100

Apuntes de Irene Muñoz 27


Medición – 2018 Mónica Vizcarra

• Normas percentilares
Consisten en un cuadro de porcentajes que corresponden a las calificaciones brutas.
El tope va a ser 100.
El percentil nos indica el porcentaje del grupo normativo (conjunto de personas) que
se encuentra debajo o encima de na calificación o puntaje.
Las normas percentilares (percentiles) se utilizan con frecuencia para propósitos de
selección y ubicación en escuelas o grupos de trabajo, además son fáciles de
comprender para la mayoría de las personas.
Sin embargo las medidas tienden a agruparse en el centro y extenderse a los extremos
de la escala, por esta razón en la interpretación debe darse mayor importancia a los
puntajes que se ubican en los extremos.

• Interpretación en relación a desviaciones standares

Dependiendo donde caiga vamos a desviar a la media o a la entera


33 una desviación mas cerca de 35 mas lejos de 50,
• desviación entera
• Desviación

Si la media es 50 y tiene 49 decimos bordeando a la media o próximo a la media


estándar, si es que 49 50 o 51 que queda próximo

Este es un tipo de interpretación percentil de acuerdo a desviaciones en funcion al


grupo normativo es decir a la muestra de estandarización .

Esta interpretación siempre tiene que estar presente

• Interpretaicon en relación a porcentajes


Relación del porcentaje que estaría por encima o debajo de la persona pero ya no en
relación al grupo normativo, por encima o por debajo en relación a su grupo de pares.
Es decir que tienen el mismo grado escolar, y que oscilan mas o menos el mismo rango
de edad. Este tipo de interpretación no es automático.

Ej 80 %
◦ El 19 o 20% de su grupo de pares tiene mejor rendimiento,
◦ el 79% presentan un desempeño por debajo de la persona

28
Medición I – 2018 Mónica Vizcarra

• Normas de clasificación Estándar


las que mas se manejan con la pruebas son los puntajes T y Z y las estaminas
Son clasificaciones o puntajes convertidos que tienen cualquier media o desviación
estándar

La intuición estándar permite comparar fácilmente la posición de desempeño de la


persona que respondió a la prueba en relación al grupo de referencia )grupo
normativo.

Existen muchos tipos de calificaciones estándar, pero los más utilizados son:
• Puntaje Z: tienen una media de 0 con desviaciones pro encima o debajo que
oscilan entre +3 y -3
Es una transformación lineal simple de los puntajes brutos, su formula es: Z = X -X/S

• Puntajes T:
Son calificaciones Normalizadas las designaciones T fue introducida por McCall e 1939
en honor a Edward Thorndike
La normalización de las calificaciones se realiza para que las pruebas sean
comparabales entre sí, para ello existe un método estadístico respecifico que afecta a
la media y a la desviación.

Es idéntico al percentil va de 0 a 50, tiene desviaciones típicas de 10

• Puntuaciones Estanueve y/o Estanina

El nombre deriva de la contracción de las palabras

Apuntes de Irene Muñoz 29


Medición – 2018 Mónica Vizcarra

30
Medición I – 2018 Mónica Vizcarra

Clasificación de los Test

Estandarizadas No Estandarizadas

Tienen instrucciones fijas para la aplicación


y calificación
Son las pruebas de aprendizaje o de clase,
Esta diseñada por expertos en el campo
por lo general están diseñadas de manera
(creadores de los tests) y se aplica a un
informal
grupo representativo de la población para
quienes está dirigido el instrumento.

Distintos tipos de calificaciones


transformadas o “normas” pueden
calcularse a partir de las calificaciones
brutas de los tests de este grupo e muestra
(grupo de estandarización)

Cognoscitivos Afectivos

Tienen el propósito de evaluar procesos y


products de la actividad menteal puede
ser:

- Instrumento de Logro, que evalúa el Están destinados a evaluar aspectos NO


conocimiento de alguna materia COGNOSCITIVOS de la personalidad como
académica u ocupación. Se centra en valores intereses, actitudes, motivos, rasgos
el comportamiento pasado de la del temperamento.
persona, lo que la persona es capaz de
aprender con una capacitación
adecuada.

- Instrumentos de Aptitud; que centran la Con este propósito, se utilizan distintas


atención en el comportamiento futuro, técnicas como la observación conductual,
es decir, en lo que la persona es capaz los inventarios de lápiz y papel y las
de aprender con una capacitación técnicas proyectivas.
adecuada.
- Por ejemplo: aptitudes mecánicas o
para el trabajo de oficina

Apuntes de Irene Muñoz 31


Medición – 2018 Mónica Vizcarra

Por su Aplicación Por límite de tiempo

- Individuales: se aplica a una sola - De velocidad: tiene limite de tiempo


persona a la vez estricto y casi nadie los termina en el
tiempo permitido, su contenido puede
estar conformado por conceptos o
tareas “sencillas”.

- De grupo o grupales: se aplica - De poder: tienen limites de tiempo muy


simultánea a varias personas. amplio, pero la prueba puede contener
conceptos más “difíciles” que los de
velocidad

Por el contenido o Tipo de Tarea

- Verbales: cuando la prueba presenta - No Verbales, el contenido de la prueba


enunciados a los que se debe de esta organizado en g´raficos o
responder o trabajar en funcion de ella, diagramas, rompecabezas, cubos
por ejemplo. Vocabulario. Es este tipo de
pruebas las “instrucciones” pueden ser
escritas o dadas de manera verbal. A

32
Medición I – 2018 Mónica Vizcarra

Aplicación de Test y Consideraciones


Éticas
Lunes 26 de marzo de 2018

Propósitos y usos de los test


Los test psicológicos y otros instrumentos de evaluación se aplican en una amplia
variedad de contextos en la sociedad:
 Escuela y Universidad
 Negocio e Industria
 Clínicas Psicológicas
 Organizaciones Gubernamentales y Militares
 Distintos Ámbitos de investigación

En la actualidad el principal propósito de los test y evaluaciones psicológicas es el


mismo que ha prevalecido desde muchos años

Evaluar el comportamiento, las capacidades mentales y otras características


personales con el objeto de ayudar en los juicios prdicciones y decisiones de las
personas.

En forma más especifica los test se utilizan para:


1. Observar a las personas que soliciten empleo y desean participar en programas
selectivos y de capacitación.
2. Clasificar y ubicar a las personas dentro de contextos educativos y de empleos
3. Asesorar y guiar a los individuos con propósitos educativos vocacionales y
personales.
4. Retener, suspender, promover o cambiar a estudiantes o empleados en los
programas educativos y de capacitación, así com en situaciones laborales.
5. Diagnosticar y prescribir tratamientos psicológicos y físicos en clínicas y
hospitales,
6. Evaluar los cambios cognitivos intra e inter personales debido a programas de
intervención educativos, psicoterapéuticos y conductuales.
7. Realizar investigaciones sobre los cambios en el comportamiento a través del
tiempo y sobre la efectividad de lps programas y técnicas nuevas

Apuntes de Irene Muñoz 33


Medición – 2018 Mónica Vizcarra

Administración de pruebas

Los resultados que se obtiene de la prueba no serán validos a menos que esta se
aplique y corrija de la manera apropiada; si esto no se hace no importa cuán bien
elaborada haya estado la prueba, los resultados no serán útiles.
En ese sentido el evaluador debe cumplir con algunos pasos:

I. Antes de la aplicación de la prueba

a) Programación de la prueba
Momento: tomar en cuenta las actividades que por lo regular desarrolla la persona y si
es un menor de edad la familia al momento de aplicar al prueba, de modo que no
sienta que interfiere con sus actividades habituales.
Se recomienda no programar pruebas a continuación de eventos agradables o
emocionantes... Cuando se trabaja con niños no es conveniente programar las
pruebas en horas de comidas, juego o en horarios en los que lleven a cabo
actividades de diversión.

Tiempo: Periodo de aplicación


Para preescolares no debería pasar de 30 min, pues este es el tiempo en que los niños
pueden mantener la atención de manera sostenida.
Por esta razón es probable que para aplicar algunas pruebas se tengan descansos o
mas de una sesión.
para escolares (primaria) el periodo de trabajan no debe pasar de 1h.
Para adolescentes adultos de 1h a 1h y media cuando se trabaja con cursos
completos o una gran cantidad de personas es necesario informar del tiempo que se
requerirá y de la clase de trabajo que se realizará.

b) Asegurar condiciones físicas satisfactorias


El lugar, la ventilación, iluminación, temperatura, nivel de ruido deben ser apropiados.
La sala de aplicación de pruebas debe estar relativamente libre de distracciones y
deben evitarse las interrupciones.

34
Medición I – 2018 Mónica Vizcarra

c) Familiarización con el instrumento


El evaluador debe conocer perfectamente la prueba que va a aplicar, habiendo
“estudiado”, con detenimiento el manual y cuidar de tener el material necesario,
ordenado conforme a los requerimientos.

d) Obtener el consentimiento
Obtener el acuerdo verbal o escrito de la persona o representante legal para la
aplicación de la prueba. este consentimiento debe ser informado.

e) Pruebas grupales
En este tipo de aplicación es importante tomar las previsiones para efectuar una
buena aplicación tomando en cuenta:
 Utilizar un espacio lo suficientemente amplio para poder sentar a las personas
separadas reduciendo de esta manera la probabilidad de copia.
 Contar con varios evaluadores o ayudantes distribuidos a los largo de la sala
para que se puedan atender a las consultas y distribuir el material.

II. Durante la prueba

a) Seguir estrictamente las instrucciones:


Mantener la estandarización de la prueba pasa por seguir estrictamente las
instrucciones señaladas para la misma. Las instrucciones deben darse de manera clara
y precisa, debemos asegurarnos de que han sido comprendidas.

b) Establecer el rapport
Significa establecer una relación de confianza, cordialidad y aceptación entre
evaluado y evaluador. Una buena relación motiva a las personas para que contesten
con seguridad y precisión, caso contrario puede suceder que exista un rendimiento
negativo por parte del evaluado.
Cuando se trabaja grupalmente no es posible establecer una relación personal sin
embargo se debe estar atento a las necesidades y reacciones individuales.

Apuntes de Irene Muñoz 35


Medición – 2018 Mónica Vizcarra

c) Permanecer alerta
Significa observar permanentemente el comportamiento de la persona para lograr
un máximo de rendimiento durante la prueba. En algunas circunstancias es necesario
ser creativo para motivar el trabajo de manera que el evaluado sienta que esta siendo
apoyado.
El evaluador debe estar preparado para afrontar problemas o situaciones especiales y
resolverlas de la mejor manera posible.

d) Ser flexibles
Permitirse cierta flexibilidad en los aspectos que asi lo permitan el instrumento como:
 Tomar en cuenta ansiedad, tensión y fatiga
 No insistir cuando la persona no puede o se niega a dar una respuesta
 Tener en cuenta los problemas perceptuales, motores, etc., del evaluado.
 Proporcionar un tiempo adicional si no se trata de pruebas de velocidad

III. Después de la prueba

Después de administrar una prueba individual el evaluador debe agrupar y guardar


en un lugar seguro todo el material, se debe inspirar seguridad a la persona que
presentó la prueba. Si se trata de un niño con un pequeño premio será suficiente, si son
adolescentes o personas mayores con palabras de aprobación bastará.
Además después de la prueba se informará lo que observó con los resultados y la
forma en que serán utilizados.
En el caso de pruebas grupales se recopilara todo el material empleado: Manuales,
hojas de respuesta, lápices, etc.

Calificación
Las pruebas pueden calificarse por medio de máquinas, a mano o plantillas de
calificación que proporcionará el editor de la prueba de acuerdo con las instrucciones
del manual.

36
Medición I – 2018 Mónica Vizcarra

¿Dónde realizar las evaluaciones? y ¿Por qué?

Educativos

Otros de
Orientación

Escenarios

de Negocios Clínicos

1. Escenarios Educativos
Se los emplea en escenarios educativos para diagnosticar problemas de
aprendizaje, de comportamiento o ambos, para establecer que tipo de programa
utilizar en educación especial.
Las pruebas de inteligencia y de logro son las más empleadas, aplicadas de forma
individual con propósito de diagnostico y por lo general son administradas por
psicólogos escolares, psicopedagogos o profesionales con capacitación similar.

2. Escenarios de orientación
Puede darse en ámbitos diversos como escuelas, prisiones, instituciones
gubernamentales o privadas. Este tipo de evaluación se realiza para identificar
diversas ventajas o desventajas con objetivo de mejorar la adaptación de
productividad y calidad de vida del evaluado.

Apuntes de Irene Muñoz 37


Medición – 2018 Mónica Vizcarra

Entra la diversidad de pruebas se encuentran las de habilidades o capacidades


sociales y académicas, las medidas de personalidad, intereses, actitudes y valores.

3. Escenarios clínicos
En esta ámbito se utilizan diferentes métodos de evaluación, como las pruebas,
entrevistas, estudios de caso y la observación conductual. Se emplean en ámbitos
como las clínicas con pacientes internos y externos, ámbitos militares, consultorios
privados, escuelas e instituciones para explorar o diagnosticar problemas
conductuales.
Las pruebas empleadas en escenarios clínicos pueden ser de inteligencia de
personalidad, neuropsicológicas u otras especializadas dependiendo de área
problemas que se presente o sospeche.

4. Escenarios de negocios
En el mundo de los negocios las pruebas se usan en muchas áreas, en especial en la
administración de recursos humanos, los psicólogos laborales usa pruebas e
instrumentos de medición para evaluar cualquier conocimiento o habilidades en las
que necesiten ser evaluado un empleado.
Entre las pruebas que se emplean están las de logro, actitud, interés, motivación,
etc.

5. Otros escenarios
Las evaluaciones y las aplicaciones de pruebas pueden llevarse a cabo para:
 Certificación en diferentes áreas o profesiones.
 Evaluación de programas.
 Investigación básica para confirmar o desechar hipótesis.
 Los tribunales relacionados con la psicología forense.
 Examinar o evaluar a personas con capacidades diferentes.
 Ámbitos neuropsicológicos.

38
Medición I – 2018 Mónica Vizcarra

Ética y Normas de los Tests


El uso cada vez más frecuente de todo tipo de tés estandarizados muestran la
importancia de crear mayor conciencia de las ventajas y limitaciones de los mismos.
Los editores reconocidos de tests comerciales piden que sus clientes cumplan
concierto requisitos dependiendo de la naturaleza del test y/o el grado de
capacitación necesaria para aplicarla en este sentido se utiliza un sistema de
calificaciones de tres niveles:

 Nivel C: venta a escuelas y otras organizaciones que utilicen como parte de


su trabajo o instrumentos de medición.
o Personas que cuenten con los certificado o licencia para aplicarlos.
 Nivel B: maestría en psicología pedagogía, capacitación equivalente para la
evaluación y formar parte de una asociación profesional que pida una
capacitación apropiada en evaluación.
 Nivel A: es la más elevada, pide doctorado en psicología, pedagogía.

Derechos de quienes responden pruebas

Derecho a dar consentimiento informado para la prueba


Las personas que responden a las pruebas tienen derecho a saber porque se les
está aplicando, como se usarán los datos de la prueba y que información, si es que
alguna, será revelada, y a quién.
La revelación debe estar por supuesto en un lenguaje que la persona que responde
la prueba pueda entender.
Si la persona que va a responder la prueba es incapaz de proporcionar un
consentimiento informado para la prueba, dicho consentimiento puede obtenerse por
medio del padre-madre o en su caso de un representante legal.
De manera ideal el consentimiento debe ser por escrito en lugar de oral y la forma
escrita debe especificar:
1. El propósito general de la prueba
2. La razón específica que se persigue en el presente caso
3. El tipo general de instrumentos que se administrarán
En caso donde las pruebas son ordenadas en forma legal (Como en una situación
ordenada por el tribunal), la obtención del consentimiento informado puede
considerarse más una “cortesía” que una necesidad.

Apuntes de Irene Muñoz 39


Medición – 2018 Mónica Vizcarra

El derecho a ser informado de los hallazgos de la prueba


Dar información realista sobre el desempeño en la prueba a los evaluados no solo
es obligatorio desde el punto de vista ético y legal, sino que también puede ser útil
desde una perspectiva terapéutica.
Las personas que responden pruebas tienen el derecho ser informadas en un
lenguaje que puedan comprender la naturaleza de los hallazgos con respecto a las
pruebas que respondieron.
También tienen derecho saber qué recomendaciones se hacen como
consecuencias de los datos de ésta.
Si los resultados de la prueba hallazgos o recomendaciones hechas con base los
datos de las pruebas son inválidos por cualquier razón (Como irregularidades en
administración de la prueba), quienes respondieron la prueba tienen derecho a saber
esto también.
El evaluador informará a quién respondió (padre-Madre, representante legal o a
ambos) el propósito, el significado de las puntuaciones, sin importar si este reporte se
hace en persona o por escrito. De manera ilegal debería estar el psicólogo calificado
para responder cualquier pregunta en relación al instrumento, calificación y/o
resultado.

Derecho que no se viole la privacidad


El concepto de intimidad reconoce la libertad de la persona para escoger por sí
mismo el momento, circunstancias y en particular el grado en que desea compartir u
ocultar con otros sus actitudes, creencias y opiniones etc.
Cierto tipo de información que atañen al evaluado que se considera no debería ser
compartido o dada a conocerse se denomina “privilegiada” esta información está
protegida por ley y no puede ni debe revelarse en un proceso legal. Para esta
situación rige el mismo criterio como la relación entre Abogado-Cliente, Doctor-
Paciente, Sacerdote-Penitente, entonces procede la relación Psicólogo-Cliente/
Paciente.
Los psicólogos que son parte de estas relaciones especiales tienen el deber legal y
ético de mantener confidenciales las comunicaciones de sus clientes.

40
Medición I – 2018 Mónica Vizcarra

Haciendo una distinción entre confidencialidad y privilegio se puede decir que


mientras la "confidencialidad" se refiere a comunicación fuera de los tribunales el
"privilegio protege a los pacientes de la revelación en procesos judiciales.
En algunos "casos" el psicólogo puede verse obligado desde el punto de vista ético
a revelar información si dicha información prevendrá un daño, ya sea al paciente o
algún tercero que esté en peligro.

Derecho a la Clasificación menos Estigmatizadora


Las normas aconsejan que siempre deben asignarse las clasificaciones menos
estigmatizadoras cuando se reporten los resultados de las pruebas, teniendo cuidado
de no caer en la Etiquetación de la persona.

Derecho a que los hallazgos se mantengan Confidenciales


Las personas que responden a las pruebas tienen el derecho a que los resultados de
sus pruebas se mantengan confidenciales y sólo sean revelados a terceros que tengan
una necesidad legitima de tener acceso a esos registros, dicha revelación también
puede estar supeditada al consentimiento informado de quien responde la prueba.
Los administradores de pruebas deben tomar precauciones razonables para
resguardar los registros de las pruebas. Si estos datos se almacenan en un archivo, esté
debe cerrarse con llave si son almacenados en una computadora, debe usarse
protecciones electrónicas para asegurar solo un acceso autorizado

Apuntes de Irene Muñoz 41


Medición – 2018 Mónica Vizcarra

42
Medición I – 2018 Mónica Vizcarra

La Inteligencia y su Medición

Definición:
Se considera la inteligencia como un constructo que señala el nivel de desempeño
cognoscitivos de una persona interviene varios procesos como: uso de lenguaje,
formación de conceptos, solución de problemas, etc. Que cambian en función del
desarrollo evolutivo.
El nivel de desempeño de estos procesos se considera representativo de una
“capacidad general” de procesamiento de la información y de símbolos abstractos
para resolver problemas.

Los investigadores coinciden en que la inteligencia está determinada genéticamente


por los efectos acumulativos de un gran muero de genes, cada uno de los cuales va a
ejercer un pequeño efecto en el desarrollo de esta función; por otro lado, debe existir
una adecuada estimulación medioambiental para que la capacidad funcional
pueda desarrollarse plenamente.

La mayoría coincide en que la inteligencia consta de una capacidad general o


unitaria y de una gama de capacidades o aptitudes medibles aisladamente; la
importancia de estas dos características varía según la edad:
En los primeros años de vida y en la niñez es más importante la capacidad general
En las etapas posteriores las aptitudes especiales se vuelven más importantes.

Apuntes de Irene Muñoz 43


Medición – 2018 Mónica Vizcarra

Curva de desarrollo

El desarrollo de la inteligencia es más rápido en la primera infancia (hasta 1:6) y de ahí


en adelante la tasa de desempeño es menor.

Thorndike y Colaborador (1926)


postularon una curva de crecimiento en base en puntuaciones de tests de
inteligencia, segun la cual casi la mitad del desarrollo intelectual se logra a los 3 años.

Bloom (1964)
Presento una conclusiones semejante al colocar a los 4 años el punto medio de La
adquisiciones de la inteligencia adulta. El desarrollo comienza a disminior en la
adolescencia y de ahí en adelante se hace mas lento.

Bayley (1968)
Realizo las que se considera las mejores estimaciones de cuando se completa el
desarrollo intelectual, a partir de la aplicación de la prueba Wechsler.
De la revisión de los resultados encontró que las puntuaciones aumentaban hasta la
edad de los 26 años, luego permanecen con cambios hasta Kids 36 años.
También hizo notar que la edad en que el desarrollo intelectual cesa varia de persona
en persona.

Además, remarco que si bien el desarrollo de la capacidad intelectual concluye en


algún momento, esto no significa que cese, si no mas bien que la persona en función
de todo el potencial que a adquirido puede aprovechar mejor sus conocimientos,
experiencia e información.

44
Medición I – 2018 Mónica Vizcarra

Aspectos estudiados en relación con la inteligencia:

Sexo
Los estudios se han centrado en tratar de determinar si los hombres y mujeres difieren
en la “inteligencia general.

 Las niñas aprenden a hablar, usar oraciones y a leer más pronto que los niños.
 Las niñas durante la escuela primaria obtienen mejores calificaciones que los
niños, pero estas diferencias tienden a desaparecer al comenzar la secundaria.
 Las mujeres presentan puntajes mas elevados en las pruebas de lenguaje y
fluidez verbal.
 Los varones en general presentan mayores habilidades en el area espacio y
numérica que las mujeres.

No se ha establecido el origen de estas diferencias pero se considera posible a que


se deban por factores culturales

Familia
Los estudios se han centrado en analizar la relación entre el tamaño de la familia
(numero de hermanos) y el nivel intelectual de los hijos:
Los resultados apuntan a establecer que si existen diferencias estas podrían explicarse
por la capacidad de estimulación cognoscitiva de que puedan disponer los padres
para cada hijo de modo que cuando hay muchos niños en la familia se recude esta
capacidad
 El grado de contacto entre padres e hijos se restringen
 También se restringen los gastos que se pueden realizar para cada un en
educación, salud etc.
 Por otro lado el nivel socioeconómico de la familia, puede tener relación con el
tamaño de la misma: en niveles superiores se tiende a formar familias
relativamente más pequeñas y por consiguiente CI más elevados.

Apuntes de Irene Muñoz 45


Medición – 2018 Mónica Vizcarra

Residencia
Los estudios se han dirigido a determinar si existen diferencias entre las personas
que viven en área rural y urbano.
Se ha establecido que en promedio el CI de los niños que habitan en el área rural es
menor al de los niños que habitan en las ciudades y que además tiende a disminuir
con el aumento de la edad, la explicación parece estar en 3 factores:
 Migración selectiva: Delos mas dotados a las áreas urbanas
 Efecto acumulativo: De un bajo nivel de estipulación intelectual
 Instrumentos de evaluación o medición del CI que son elaborados por personas
urbanas.

Significado de un CI

Cuando se evalúa se debe especificar siempre el test de donde se obtuvo ya que los
distintos tests de inteligencia difieren en el contenido y en otros aspectos que afectan
la interpretación de las puntuaciones.

1ro la inteligencia debería ser considerada como un concepto descriptivo y no


explicativo, un CI es una descripción del nivel de la capacidad del individuo en un
momento dado en relación con sus normas de edad.

2do el CI no es algo fijo e inalterable se puede modificar por la influencia del ambiente
la inteligencia de un individuo en cualquier momento es el producto final de una vasta
y compleja secuencia de interacciones entre los factores ambientales y hereditarios.

3ro. La inteligencia no es una capacidad única y unitaria sino un compuesto de


varias funciones, el término se emplea para abarcar la combinación de aptitudes
requeridas para la supervivencia y el progreso en una cultura concreta.

46
Medición I – 2018 Mónica Vizcarra

Conclusión

Fecha

Apuntes de Irene Muñoz 47

You might also like