You are on page 1of 181

SESIN N1: PSICOMETRA I

1.
2.
3.
4.
5.
6.

Introduccin: Definicin de Instrumentos o Pruebas


Psicolgicas.
Etapas en la Construccin de una Prueba.
Fuentes de Error en el Proceso de Medicin.
Poniendo a Prueba los Test .
Los modelos de los test.
Modelos Bsico en la Construccin de los Test.

Qu es la Ciencia?
Objetivos
Describir, Explicar, Predecir, Controlar

La Psicologa
es una Ciencia?
DIMENSIONES DE LAS
ESTRATEGIAS
1.
Diseo
2.
Ambiente
3.
Recopilacin de
los datos

Caractersticas

Lgica, Determinista, General, Parsimoniosa,


Especfica, Emprica, Intersubjetiva, Pblica

Modalidades investigacin
en Psicologa

METODOLOGA EXPERIMENTAL

HIPTESIS CAUSALES
DISEOS EXPERIMENTALES - CUASI EXPERIEMNTALES

Manipulativo-Experimental
Asociativo Correlacional

Mtodo Cientfico

Fases investigacin
Planteamiento Problema
Formulacin Hiptesis
Eleccin Metodologa
OPERATIVIZACIN VARIABLES
MEDICIN VARIABLES
EVALUACIN MTRICA INSTRUMENTOS*
Seleccin muestra
Recogida de los datos
Anlisis de datos
Contrastacin Hiptesis
Interpretacin resultados
Reporte de investigacin

METODOLOGA NO EXPERIMENTAL*
HIPTESIS DE COVARIACIN
DISEOS NO EXPERIMENTALES

1.

INTRODUCCIN: Meta de las Ciencias


Comportamiento
es
el
ESTABLECIMIENTO
PRINCIPIOS GENERALES para:

del
DE

1. DESCRIBIR.

2. EXPLICAR.
3. PREDECIR

IMPLICA: Recoger y comparar datos (MEDICIN).


Ejemplo: Estudios de Fester y Skinner (1957) hechos
sobre el registro de UN CUARTO DE BILLN DE
RESPUESTAS.

- La rama que se dedica a LOS PROCESOS DE


MEDICIN en Psicologa es la Psicometra.
1.1 DISCIPLINA
vertiente:
1. Terica

METODOLGICA

con

una

doble

: Fundamentacin terica de la
medida.

2. Prctica : Construccin, evaluacin y


aplicacin de instrumentos de
medida para EVALUAR o MEDIR
CONDUCTAS.
(Escudero y Prez-Gil, 2007).

Comportamiento Humano

OBJETO
ESTUDIO

Psicologa
como
Ciencia

(Objeto con caractersticas


particulares)

1. Precisa de aspectos
especficos.
2. Precisa de tcnicas e
instrumentos de medicin
diferentes
MEDICIN EN
PSICOLOGA

3.

Qu

es

medir?:

Establecer
correspondencia entre un conjunto particular
de elementos reales y otro de elementos
formales.
* ROL TRADUCTOR AL EXPRESAR DIFERENTES
FENMENOS PSICOLGICOS EN LENGUAJE
FORMAL Y UNIVERSAL*

4. Medir lo Psicolgico:

Consideracin
de constructos o caractersticas latentes (no
observables directamente).
*RELACIONAR CONCEPTOS ABSTRACTOS CON
INDICADORES EMPRICOS*

**NDICES ESTADSTICOS

1. OBSERVAR
UNA
CONDUCTA

2. CONSTRUCTO

11. DEFINICIN
OPERACIONAL

2.1 DEFINICIN
CONCEPTUAL

10. ANLISIS

COMPLEMENTARIOS
(TEST)

2.2
DIMENSIONES

3. INDICADORES

4.1 ESTRUCTURA
FACTORIAL
TERICA

4.2 ANLISIS
VALIDEZ
CONTENIDO
(JUECES
EXPERTOS)**

5. PRUEBA
PILOTO
(MUESTRA No
Objetivo)

9. ANLISIS **
PUNTUACIONES
TEMS Y DE LA
PRUEBA
(Propiedades
Mtricas)
8. APLICACIN
PRUEBA (MUESTRA
Objetivo)

4. ITEMS

7. SELECCIN
PRELIMINAR DE LOS
ITEMS **

6. ANLISIS
**PUNTUACIONES
DE LOS ITEMS
(Propiedades
Mtricas)

1.2 .DEFINICIN
PSICOLGICAS:

DE

INSTRUMENTOS

PRUEBAS

1.2.1 Prueba Psicolgica:


Es un procedimiento
estandarizado para obtener una muestra de conducta
y describirla con base en categoras o puntuaciones
(normas o estndares) que permiten utilizar los
resultados para predecir otras conductas.
(Gregory, 2012).

1.2.1.1 Caractersticas de las pruebas (Gregory, 2012):


1. Procedimientos Estandarizados.
2. Muestra de Conducta.

3. Permite obtener puntuaciones o derivar


categoras.
4. Contemplan Normas o Estndares.
5 Predicen conductas no evaluadas.

1.2.1.1 Caractersticas de las pruebas (Gregory, 2012):


1. Procedimientos Estandarizados: Implica que los
procedimientos de aplicacin de la prueba son
uniformes de un examinador a otro y de una situacin
a otra.
- Implica en parte las habilidades del evaluador.

- Depende principalmente de las instrucciones de


aplicacin.
- Presentar materiales con estmulos similares a
todos
los
aplicadores
(psicometristas
o
evaluadores).
- Aconsejar al evaluador o examinador sobre la
forma de manejar diversas dudas del examinado.

2. Muestra de Conducta: Es una muestra limitada de


conductas dado que existen RESTRICCIONES
PRCTICAS (el evaluado y el examinador no tienen
tiempo suficiente) para una prueba realmente
detallada de un dominio conductual bien definido y
finito.
- La muestra de conductas es de inters en la
medida que permite hacer inferencias acerca del
dominio relevante de conductas.

Ejemplo: Se le aplica a un adulto la Escala de


Inteligencia de Adultos IV (WAIS-IV) y es capaz de
definir 35 palabras de una sub prueba de
vocabulario.

Aplicacin:
Consecuencias directas: Es un puntaje alto en la sub
prueba.
Significado Indirecto:
general del evaluado.

El nivel de conocimiento

Cuestin Esencial: Permite predecir conductas que


no se evalan directamente.

3. Permite obtener puntuaciones o derivar categoras:


- Las pruebas psicolgicas resumen el desempeo de
los evaluados en nmeros y, posteriormente los
clasifican.

- En trminos psicomtricos, las pruebas miden


diferencias individuales respecto a rasgos o
caractersticas, las cuales, estn presentes en
diferente cantidad.
Dos advertencias:
1 Toda puntuacin de la prueba reflejar SIEMPRE
cierto grado de ERROR DE MEDICIN.

- La IMPRECISIN de las pruebas es INEVITABLE.


- Las Pruebas deben basarse en una MUESTRA
EXTERNA
DE
CONDUCTAS
para
ESTIMAR
(paradjicamente) una CONDUCTA NO OBSERVABLE
(inferida).
- La TCT la expresa con la ecuacin X = V e

donde;
X= Es la puntuacin observada.
V = Es la puntuacin verdadera
e = Componente de error positivo o negativo.

- Un Psicmetra y, posteriormente un evaluador


tratar que el error sea muy pequeo aunque, nunca
se puede eliminar por completo ni esa posible
conocer su efecto exacto sobre el caso individual.
2 Los resultados de un test representan una
ABSTRACCIN DE LA CONDUCTA OBSERVADA , la
cual, ha demostrado ser til para PREDECIR
CONDUCTAS QUE NO SE EVALAN.

- Evitar materializar las caractersticas medidas dado


que el Modelo Predictivo est formalizado mediante
un Modelo Estadstico, a saber: P (X )
donde: = Conducta No Observada y X = Conducta
Observada.

4. Contemplan Normas o Estndares: La puntuacin de


un sujeto en un test es interpretada al COMPARARLA
con las puntuaciones obtenidas por otros individuos en
el mismo test.
- Los Psicmetras (Diseadores y Constructores de
Pruebas)
comunican
las
NORMAS
(CRITERIOS
ESTADSTICOS), las cuales, son un resumen de los
resultados obtenidos en un grupo grande y
representativo de sujetos (GRUPO NORMATIVO es una
MUESTRA DE ESTANDARIZACIN), la cual, permite
determinar la posicin del evaluado con referencia a
l.
NORMAS: Establecen desempeo promedio e indican
la frecuencia con que se obtienen distintos puntajes.

5 Predicen conductas no evaluadas:

- La prueba no es un fin en si misma.


- Es importante conocer el desempeo en las
conductas que la prueba mide, as como tambin,
en conductas que a partir de ellas se pueden
hacer predicciones.
Ejemplo: Al conocer los niveles de CI de una
persona es posible hacer predicciones sobre el
rendimiento cognitivo.

1. 2.2 Variables de los Instrumentos:


1. Contenido.
2. Formato.
3. Aplicacin.
4. Puntuacin.
5. Calidad Tcnica.
(Cohen y Swerdlik, 2006)

1.2.3 Contenido: Refiere a los temas de la prueba.


- Varan segn el enfoque terico
maneje.

que la misma

Ejemplo: Personalidad.

- Los reactivos de una prueba de personalidad a


partir de la teora Psicoanaltica tiene poco parecido
a la prueba basada en la Teora Existencial.
- Ambas son pruebas de Personalidad.

Formato: Refiere a

1. Forma
2. Plan:
3. Estructura: Protocolo de la Prueba.

4. Arreglo o disposicin de los reactivos.


5.Consideraciones especficas: Registro de
respuesta, instrucciones y lmites de tiempo.
6. Computarizada o de lpiz y papel.

Procedimiento de aplicacin:

1. Evaluacin Individual.
2. Evaluacin Grupal.
3. Rol del Evaluador:

3.1 Presente (Hetero aplicacin)


3.2 Ausente (Auto aplicacin).

2.2.4 Puntuacin:
1. Proceso sumatorio de los puntos.
2. En funcin de las respuestas de un sujeto en el
desempeo de una prueba o tareas.
3. Opciones de respuesta:

3.1 Desacuerdo hasta Acuerdo.


3.2 Presente - Ausente
4. Categorizacin de respuestas: Uso de Puntos de
Corte (Mediana u otro criterio).

Calidad Tcnica:
1. Refiere al SONDEO PSICOMTRICO de una prueba.
2. Implica: Consistencia y Precisin de las puntuaciones de la
prueba.
3. FIABILIDAD:

3.1 Consistencia de las Puntuaciones.


3.2 Error No Sistemtico.
3.3 Responde a la pregunta de investigacin
Con cunta exactitud la muestra de tems o tareas
representa al universo de tems desde donde fueron
seleccionados?

PERSPECTIVAS TERICAS (Navas, 2001)


Teoras
Generalizabilidad
(TG)

Teoras
Clsica
Test (TCT)
2
Aplicaciones
Test

1.
2.

1 Aplicacin
Test

ESTABILIDAD
TEMPORAL

CONSISTENCIA
INTERNA

Test-Retest
Formas
Paralelas

1.
2.

Dos mitades
Alpha
Cronbach

Teora de la
Generalizabilidad

Teora
Respuesta
tem (TRI)
Informacin
Acuerdo
Interjueces

Consistencia
de las
clasificaciones

ESTUDIO DE LA FIABILIDAD TCT (Doval, 2002)

Ms de una
aplicacin del
instrumento

ESTABILIDAD
Formas Paralelas

Test- Retest

Coeficientes de
Equivalencia
(Entre-evaluadores)

Coeficientes de
Estabilidad
(Intra-evaluadores)

PROCEDIMIENTO

PROCEDIMIENTO

1. Coeficiente de
Fiabilidad con
r de Pearson

1. Coeficiente de
Fiabilidad con
r de Pearson

Una nica aplicacin del


instrumento compuesto por k
unidades

CONSISTENCIA INTERNA
Dos mitades

K-partes

Coeficiente de dos
Mitades

Coeficiente de
consistencia interna

PROCEDIMIENTOS

PROCEDIMIENTOS

1. Ruln
2. Spearman Brown
3. Gutmann

1. Alpha Cronbach
2. KR -20
3. KR-21

4. VALIDEZ:
4.1 Precisin de las puntuaciones.
4.2 Error Sistemtico.
4.3 Responde a la pregunta de investigacin:

Con qu fidelidad corresponde este universo al


atributo latente que se va a medir?

1.1 PROPIEDADES PSICOMTRICAS

FIABILIDAD: Grado de
consistencia de una medida.
Tipos:

1. Ms de una Aplicacin:
ESTABILIDAD
1.1 Formas Paralelas.
1.2 Test-Retest.
2. Una nica aplicacin:
CONSISTENCIA INTERNA.
2.1 Dos mitades.
2.2 K-partes.

Validez: Grado en el que el instrumento de


medicin con exactitud el constructo terico
para el que fue diseado.
TIPOS:
1. Contenido : Aparente, Muestral y Curricular.
2. Constructo : Convergente, Discriminante,
Factorial.
3. Criterial

: Predictiva, Concurrente,
Retrospectiva.

Ejemplo Coeficiente de Fiabilidad mediante Formas


paralelas: Un psicmetra se encuentra interesado en
conocer la fiabilidad de una Prueba de Ansiedad
que ha construido con dos formas (A y B). Para tal
efecto, administra a 10 pacientes seleccionados al
azar por un psiclogo clnico
encuentra los
siguientes resultados:

Matriz de Datos:
Pacientes

X
(Forma A)

Y
(Forma B)

19

39

11

13

28

20

39

29

29

10

23

24

11

14

12

37

26

FRMULAS COEFICIENTES DE FIABILIDAD


ESTABILIDAD
2 APLICACIONES
FORMAS PARALELAS

S xy
rxy
Sx S y

CONSISTENCIA INTERNA
2 MITADES (1 APLICACIN)
MTODO DE RULN

p i 2
n

rvx 1

X2

TEST-RETEST

S xy
rxy
Sx S y

1 APLICACIN

ALPHA DE CRONBACH

p i

X
n

SPEARMAN BROWN

rSB

N 1

2
S
i
S t2

KUDER RICHARDSON 20
2
N t pq
KR20

N 1
t2

kr0

1 (k 1)r0

GUTMANN

S12 S 22
rG 21
2
S
t

KUDER RICHARDSON 21

N x (n x )

KR21
2
N 1
n x

- Frmula Coeficiente
Paralelas:

rxy

de

Fiabilidad

Formas

n X iYi X i Yi

n X X i n Yi Yi
2
i

1.

ANLISIS DE LA RELACIN:
1.1 Tipo de Relacin.
1.2 Valor del Coeficiente de Correlacin.
1.3 Patrn de Correlacin.
1.4 Criterio de Clasificacin (descriptor del valor de
rxy) e Interpretacin Coeficiente Correlacin.
1.5
Error
Tpico
(Desviacin
Estndar
del
Coeficiente)
1.6 Varianza Explicada (Proporcin y Porcentaje).
1.7 Varianza No Explicada (Proporcin y
Porcentaje).
1.8 Covarianza y Comprobacin rxy

- CRITERIOS DE CLASIFICACIN COEF. CORRELACIN


(Prez, Garca. Gil y Galan,2009):
Valor Coeficiente

Interpretacin

1.00 - 0.91

Correlacin Muy Alta (Muy


elevada)

0.90 - 0.71

Correlacin Alta
(Elevada)
Correlacin Media (Marcada,
Notable)

0.70 - 0.41
0.40 - 0.21
0.20 -

0.00

Correlacin Baja
Correlacin Muy Baja

- Integracin de Rangos Interpretacin Coeficientes de


Fiabilidad (Nunally, 1978; Magnusson, 1983; Thorndike,
1989; Carretero-Dios, 2007; EFPA, 2011).
Rangos

Magnitud

Campo
Aplicacin

MODELO EFPA
(Muiz, 2011)

0.81-1.00

Muy Alta
(ACEPTABLE)

Decisiones
Importantes Personas
(0.90 o ms)

r > 0.90
(EXCELENTE)

Comparacin de
Grupos (0.80 o ms)

0.80 < r < 0.90


(BUENA)

0.70 < r < 0.80


(ADECUADO)
0.61-0.80

Alta
(ACEPTABLE)

0.41-0.60

Moderada

0.21-0.40

Baja

0.00-0.20

Muy Baja

Investigacin
(0.70 o ms)

r < 0.70
(INADECUADO)

2. ANLISIS INFERENCIAL:
2.1 Hiptesis Estadsticas.
2.2 Diagrama Contraste.
2.3 Conclusin Breve.
2.4 Clculo Error Estndar de la Medicin (Error
Psicomtrico).
2.5 Clculo Intervalos de Confianza.
2.6 Clculo de Longitud de la Prueba (en caso de
ser necesario).
2.7 Clculo Error Muestral (Error Estadstico)

CONTRASTE DE HIPTESIS:

1. Hiptesis Nula

H0 : 0

(No hay relacin estadsticamente significativa entre las


puntuaciones de las Formas A y B).

2. Hiptesis Alterna H1 : 0
(Hay relacin estadsticamente significativa entre las
puntuaciones de las Formas A y B).

FRMULA :
t
rxy
obs

n2
2
1 rxy

Construccin de los Intervalos de Confianza:

1 Fcrtico rxy 1 Fcrtico


rlmite inf erior
1 Fcrtico 1 Fcrtico rxy
1 Fcrtico rxy 1 Fcrtico
rlmite sup erior
1 Fcrtico 1 Fcrtico rxy
NOTA: En estas ecuaciones rxy es el coeficiente de
correlacin de la muestra y F es el valor crtico en funcin de
los grados de libertad (n-2) y un error permitido mediante .
(Blair y Taylor, 2008).

ERROR ESTNDAR:

EEM Sp 1 rF
donde:
EEM = Error estndar de medicin
Sp = Desviacin estndar de las puntuaciones
totales del test
r F = Coeficiente de Fiabilidad

Para clculo de Sp utilice la frmula:

Sp

nx 1 sx2 ny 1 s y2
nx 1 ny 1

Para clculo de Sp utilice la frmula:

Sp

nx 1 sx2 ny 1 s y2
nx 1 ny 1

1-. Calcule cul debera ser la longitud de la prueba


(nmero de tems que debera tener) para alcanzar
un nivel de fiabilidad de 0.70, 0.80 y 0.90.

Utilice la Frmula:

Rxx 1 rF
N
rF (1 rF )

donde:
Rxx= Es el coeficiente de Fiabilidad que se espera
alcanzar.
rF = Es el coeficiente de fiabilidad obtenido.
1 = Constante.

2-. Clculo de tems esperados (n):


donde:

n N n

n = nmero de tems que tenda el test


n = nmero de tems que tiene el test actualmente
N = Razn obtenida entre la fiabilidad esperada y la
fiabilidad obtenida.

ERROR MUESTRAL PARA MUESTRAS FINITAS (n<100,000)

EM

2
z p q
n

TAMAO MUESTRAL PARA POBLACIONES INFINITAS


(n>100,000)
2

z p q

Ejemplo Coeficiente de Validez Convergente: Un


psicmetra se encuentra interesado en conocer la
validez mediante el uso de un criterio externo de
una Prueba de Ansiedad que ha construido. Para tal
efecto, administra a 10 pacientes seleccionados al
azar por un psiclogo clnico la prueba que l ha
construido (variable X) y una prueba que otro
investigador ha construido para medir la ansiedad y
encuentra los siguientes resultados:

Matriz de Datos:
Pacientes

X
(Test Investigador)

Y
(Test del Otro Investigador )

15

37

34

33

22

36

11

11

10

20

15

12

25

16

31

40

10

11

10

34

12

37

32

- Frmula Coeficiente de Validez Convergente:

rxy

n X iYi X i Yi

n X X i n Yi Yi
2
i

1.

ANLISIS DE LA RELACIN:
1.1 Tipo de Relacin.
1.2 Valor del Coeficiente de Correlacin.
1.3 Patrn de Correlacin.
1.4 Criterio de Clasificacin (descriptor del valor de
rxy) e Interpretacin Coeficiente Correlacin.
1.5
Error
Tpico
(Desviacin
Estndar
del
Coeficiente)

- CRITERIOS DE CLASIFICACIN COEF. CORRELACIN


(Prez, Garca. Gil y Galan,2009):
Valor Coeficiente

Interpretacin

1.00 - 0.91

Correlacin Muy Alta (Muy


elevada)

0.90 - 0.71

Correlacin Alta
(Elevada)
Correlacin Media (Marcada,
Notable)

0.70 - 0.41
0.40 - 0.21
0.20 -

0.00

Correlacin Baja
Correlacin Muy Baja

Coeficiente de Validez:
Correlacin Test-Criterio (Muiz, 2011)

SIGNIFICACIN

VALOR COEFICIENTE
CORRELACIN

INADECUADA

r < 0.20

ADECUADA

0.20 < r < 0.35

BUENA

0.35 < r < 0.50

EXCELENTE

r > 0.50

Validez Convergente: Correlaciones con escalas


similares (Muiz, 2011)

SIGNIFICACIN

VALOR COEFICIENTE
CORRELACIN

INADECUADA

r < 0.55

ADECUADA

0.55 < r < 0.65

BUENA

0.65 < r < 0.75

EXCELENTE

r > 0.75

2. ANLISIS INFERENCIAL:
2.1 Hiptesis Estadsticas.
2.2 Diagrama Contraste.
2.3 Conclusin Breve.
2.4 Clculo Error Estimacin del Criterio (Error
Psicomtrico).
2.5 Clculo Intervalos de Confianza.
2.6 Clculo de Longitud de la Prueba (en caso de
ser necesario).
2.7 Clculo Error Muestral (Error Estadstico)

CONTRASTE DE HIPTESIS:

1. Hiptesis Nula

H0 : 0

(No hay relacin estadsticamente significativa entre las


puntuaciones de las Formas A y B).

2. Hiptesis Alterna H1 : 0
(Hay relacin estadsticamente significativa entre las
puntuaciones de las Formas A y B).

FRMULA :
t
rxy
obs

n2
2
1 rxy

Construccin de los Intervalos de Confianza:

1 Fcrtico rxy 1 Fcrtico


rlmite inf erior
1 Fcrtico 1 Fcrtico rxy
1 Fcrtico rxy 1 Fcrtico
rlmite sup erior
1 Fcrtico 1 Fcrtico rxy
NOTA: En estas ecuaciones rxy es el coeficiente de
correlacin de la muestra y F es el valor crtico en funcin de
los grados de libertad (n-2) y un error permitido mediante .
(Blair y Taylor, 2008).

- ERROR DE ESTIMACIN DEL CRITERIO: Para ello se


utiliza la siguiente frmula:

y x S y 1

2
xy

Donde:

Sy = Es la desviacin tpica de las puntuaciones en


el criterio.

xy = Es el coeficiente de validez en el test.

1-. Calcule cul debera ser la longitud de la prueba


(nmero de tems que debera tener) para alcanzar
un nivel de fiabilidad de 0.70, 0.80 y 0.90.

Utilice la Frmula:

Rxx 1 rF
N
rF (1 rF )

donde:
Rxx= Es el coeficiente de Fiabilidad que se espera
alcanzar.
rF = Es el coeficiente de fiabilidad obtenido.
1 = Constante.

2-. Clculo de tems esperados (n):


donde:

n N n

n = nmero de tems que tenda el test


n = nmero de tems que tiene el test actualmente
N = Razn obtenida entre la fiabilidad esperada y la
fiabilidad obtenida.

ERROR MUESTRAL PARA MUESTRAS FINITAS (n<100,000)

EM

2
z p q
n

TAMAO MUESTRAL PARA POBLACIONES INFINITAS


(n>100,000)
2

z p q

2. FASES DEL DESARROLLO DE UNA PRUEBA

FASE 1: DEFINICIN DE LA PRUEBA

FASE 2: ELECCIN MTODO DE


ESCALAMIENTO DE LA PRUEBA

FASE 3: ELABORACIN DE
LOS REACTIVOS

FASE 4: ANLISIS DE
LOS REACTIVOS

FASE 5: REVISIN DEL


INSTRUMENTO

FASE 6: PUBLICACIN DEL


INSTRUMENTO

(Gregory, 2012 )

Esquema de la relacin entre los planos terico, emprico


y matemtico desde el punto de vista de la medicin.

Representacin formal de

PLANO TERICO
Modelo terico que incluye los
conceptos (constructos) que
definen a las VARIABLES
LATENTES.

los modelos

Representacin emprica

PLANO MATEMTICO
Representacin formalizada del
modelo y representacin
numrica de los indicadores
empricos

Representacin numrica de los

de los constructos

indicadores

PLANO EMPRICO
Indicadores empricos de las
variables latentes
(Favorece la
Operacionalizacin)

RESPONDER A LAS SIGUIENTES PREGUNTAS


PREGUNTAS

RESPUESTAS

Cul va a ser el contenido del test ?

CONTENIDO

Qu tipo de tems se van a utilizar ?

FORMATO

Cuntos tems debe tener la prueba ?

LONGITUD

Qu propiedades mtricas debe tener ?

INDICADORES PSICOMTRICOS

ESPECIFICACIN DE LAS ETAPAS:


1. Definicin de la Prueba:
-Definir Teora de Base del constructo,
- Seleccin del Constructo,
- Objetivos de la Escala,
- Revisin de la literatura

- Deteccin de indicadores y dimensiones emergentes


(Tcnica Grupos Focales) .

Diseo de Investigacin: EXPLORATORIO SECUENCIAL (Fase


Derivativa. Ver en Hernndez Sampieri, 2010)
FORMATO GENERAL

FASE CUALITATIVA

FASE CUANTITATIVA

1. Recoleccin Datos Cualitativos


(Grupos Focales)

1. Recoleccin Datos Cuantitativos


1.1 Estudio Piloto (Versin
Preliminar).

2. Anlisis Cualitativo (Indicadores,


Dimensiones Emergentes del
Constructo)

2. Anlisis Propiedades Mtricas


2.1 tems
2.2 Prueba
3. Ensamblaje Definitivo
3.1 Versin Final.

2. Eleccin mtodo de escalamiento de la prueba:


- Establecimiento de reglas de medicin : asignacin
de nmeros a las respuestas).
2.1
Mtodo
de
escalamiento
representativo
(ordenamiento de expertos validez de contenido) :
Clasificacin ordinal de los jueces expertos para
analizar la validez de contenido de los tems;

Los jueces expertos calificarn los tems con la siguiente escala:

REVISOR: ______________________________________

FECHA: _________

Por favor, lea con cuidado la especificacin de dominio para esta


prueba. A continuacin indique qu tan bien considera que el
reactivo refleja la especificacin del dominio. Juzgue el reactivo
nicamente con base en la correspondencia entre su contenido y el
contenido definido por la especificacin del dominio.
AFIRMACIN: Acostumbro a sonrojarme cuando tengo que hablar con
personas desconocidas.

Utilice la Escala de calificacin de cuatro puntos que se muestra a continuacin.

1.

IRRELEVANTE

_____________

2. BAJA RELEVANCIA

3. MODERADA RELEVANCIA

4. ALTA RELEVANCIA

_____________

_____________

_____________

Seale la Dimensin a la cul pertenecera la presente afirmacin.

COGNITIVO
_____________

EMOCIONAL
_____________

CONDUCTUAL
_____________

OTRA
_____________

Propuesta de Redaccin del tem (si lo estima del caso):

Adaptado de (Gregory, 2012)

Interpretacin valores obtenidos conforme a los rangos


sealados:
VALOR OBTENIDO
0.75 o MS

ACUERDO
Excelente

INTERPRETACIN
Alta Relevancia

0.60-0.74

Excelente

Alta Relevancia

0.40-0.59

Bueno

Moderada
Relevancia

0.39 o MENOS

Pobre

Baja Relevancia

DECISIN
Incorporarlo en
la Prueba (I)
Incorporarlo en
la Prueba (I)
Incorporarlo en
la Prueba previa
si el segundo
acuerdo de los
jueces es igual o
mayor que 0.60
(R)
Eliminarlo de la
Prueba (E)

Adaptado de (Pardo y Ruiz, 2002)

2.2 Mtodo de Escalamiento Absoluto 1: Clasificacin


ordinal de los datos registrados (formato de
autoinforme) a partir de las respuestas de los
participantes
del
estudio
para
analizar
la
discriminacin, fiabilidad y validez de los tems.

Ejemplo: ESCALA DE RESPUESTA de 5 categoras


1

Totalmente en
desacuerdo

En
desacuerdo

Ni de acuerdo
ni en
desacuerdo

De acuerdo

Totalmente de
acuerdo

- Segn De la Garza, Morales y Gonzlez (2013)

CRITERIOS CLASIFICACIN NDICES DE DISCRIMINACIN (Ebel, 1965;


Garca-Cueto y Fidalgo, 2005), FIABILIDAD Y VALIDEZ TEMS (Thorndike,
1989; Magnusson, 1983) :
NDICE DISCRIMINACIN

NDICE FIABILIDAD Y VALIDEZ

VALOR

INTERPRETACIN

VALOR

0.40 o ms

El tem discrimina
muy bien

0.81-1.00 o Ms

INTERPRETACIN
Muy Alta
(ACEPTABLE)

(ACEPTABLE)

0.30 - 0.39

Alta

0.61-0.80

(ACEPTABLE)

(ACEPTABLE)

0.20 - 0.29

Moderada

0.41-0.60

Baja

0.21-0.40

Muy Baja

Baja
(ELIMINAR)

(ELIMINAR)

0.10 o Menos

Moderada
(ACEPTABLE CON REVISIN
NUEVA)

(ACEPTABLE CON REVISIN


NUEVA)

0.10 - 0.19

Alta

Menos de Cero -0.20

Muy Baja

2.3
Mtodo
de
Escalamiento
Absoluto
2:
Escalamiento complejo de las puntuaciones por
dimensiones y puntajes totales de los instrumentos
(independencia, normalidad y homocedasticidad).

3. Fase de Elaboracin de los reactivos (tems): A


partir de los mtodos de escalamiento indicados, se
utilizar una Escala de Respuestas ordenadas sobre
un continuo de respuestas con un continuo de
acuerdo
o
desacuerdo
y
de
aprobacin
desaprobacin.
- En tal sentido, los procedimientos para
construccin de los tems de las escalas sern:
3.1 Mtodo Racional.

3.2 Mtodo de Clave Emprica.

la

3.1 Mtodo Racional (consistencia interna):


- Asume los puntajes de los reactivos de la escala
tendrn valores positivos en los coeficientes de
correlacin entre los tems y con los puntajes totales
de las dimensiones y de la escala

3.2 Mtodo de Clave Emprica:


- Algunos de los tems no exhibiran una relacin clara
con las evidencias obtenidas en las investigaciones
cientficas revisadas (deteccin de indicadores y
dimensiones emergentes del constructo en la fase
cualitativa
va
focus
groups)
y,
porque
eventualmente permitira distinguir diferentes grupos
de sujetos.
- Se tratar de responder la las preguntas sobre la
homogeneidad de los reactivos (tems), el rango de
dificultad, fiabilidad y validez que tienen y,
finalmente, cuntos reactivos se construirn y tendr
los instrumentos en su versin inicial

4. Fase de Anlisis de los Reactivos:


4.1 Fase Cualitativa: se realiza una codificacin axial
de las evidencias procedentes tanto de la revisin
bibliogrfica como de los datos obtenidos mediante
focus group.
- Posteriormente se realizar el proceso de
codificacin abierta y la obtencin de categoras
emergentes.

4.2 Fase Cuantitativa:


- Se realiza anlisis de la frecuencia, obtencin de
medidas de tendencia central (mediana, moda y
media), medidas de variabilidad (desviacin
estndar, varianza y cuas varianza).
- Se aplica el instrumento provisorio a la muestra
seleccionada
previamente
(muestreo
no
probabilstico) .
- Se evalan las propiedades mtricas provisorias de
las puntuaciones de los tems, dimensiones y de la
escala total. Las propiedades mtricas provisorias a
evaluar sern confiabilidad, validez, discriminacin,
homogeneidad y comparabilidad.

Diseo de Investigacin: EXPLORATORIO SECUENCIAL (Fase


Derivativa. Ver en Hernndez Sampieri, 2010)
FORMATO GENERAL

FASE CUALITATIVA

FASE CUANTITATIVA

1. Recoleccin Datos Cualitativos


(Grupos Focales)

1. Recoleccin Datos Cuantitativos


1.1 Estudio Piloto (Versin
Preliminar).

2. Anlisis Cualitativo (Indicadores,


Dimensiones Emergentes del
Constructo)

2. Anlisis Propiedades Mtricas


2.1 tems
2.2 Prueba
3. Ensamblaje Definitivo
3.1 Versin Final.

- Para los escalamientos 1 y 2 se utilizan:


4.2.1 Procedimientos estadsticos de distribucin
libre (prueba de acuerdo interjueces a partir de los
trabajos de Martuza (1977), Hambleton (1984), Bausel
(1986) (en Gregory, 2012) y la correlacin de rangos
ordenados, la prueba de U de Mann Whitney).
4.2.2 Se evaluarn los ndices de validez de
contenido de las puntuaciones de los tems, ndices
de discriminacin, fiabilidad (consistencia interna) y
validez (criterio).

- Para el Escalamiento 2 se utiliza:


4.2.3 Se utilizan los procedimientos estadsticos
paramtricos para:
1-. Evaluar supuestos (Prueba de Normalidad de
Kolmogorov-Smirnov o Shapiro Wilks en funcin de los
tamaos muestrales, Prueba de Rachas para evaluar
independencia de las puntuaciones),
2-. Anlisis de la Varianza para evaluar la
homocedasticidad, prueba de correlacin productomomento de Pearson para evaluar fiabilidad y validez
provisorias de las puntuaciones, anlisis de la
regresin lineal, mltiple y multinomial, Prueba de
diferencias de medias t y ANOVA).

4.2.4 Anlisis de la Fiabilidad Provisoria de las


puntuaciones de los instrumentos, se utiliza ndice de
fiabilidad Alfa de Cronbach y el error tpico de
medida.
4.2.5 Anlisis de la validez provisoria de las
puntuaciones mediante Anlisis Factorial. La validez
de criterio externo (convergente y/o divergente)
provisoria se obtendr mediante mediante el ndice
de correlacin de Pearson.
4.2.6 Normas Provisorias de las puntuaciones de la
prueba se evalan mediante puntuaciones derivadas
(rangos percentiles) y estndar (puntuaciones z,
puntaje T, estaninas y el puntaje de aproximacin a la
distribucin normal).

5. Fase de Revisin del Instrumento:


5.1 Una vez eliminados los tems que tengan baja
discriminacin fiabilidad y validez de la etapa
anterior, con una muestra de similares caractersticas
que las etapas anteriores a fin de recabar
informacin adicional sobre el anlisis de los reactivos
para realizar los ajustes mtricos que se estimen
necesarios (menores o mayores).
5.2 En funcin de los ajustes que se identifiquen, se
realizara adicionalmente un procedimiento de
validacin cruzada para confirmar nuevamente la
validez de las puntuaciones de la prueba dado que
la validez de criterio original (obtenida en la etapa
anterior) es preliminar y tentativa (provisoria). .

5.3 El fundamento tcnico de esta etapa es utilizar la


ecuacin de regresin original en esta nueva muestra
para analizar si es que las puntuaciones del
instrumento construido predicen las del criterio.
NOTA: Dado que las evidencias muestran que la
validacin cruzada predice el criterio con menor
precisin, se puede hacer una prueba de reduccin
de la validez a fin de evaluar mediante los ndices de
correlacin entre las puntuaciones totales de los
instrumentos y del criterio si es que la cantidad de
tems de la escala ser ajustado en trminos leves,
moderados o fuertes.

6. Publicacin de los Instrumentos: En el caso que los


instrumentos tengan un respaldo emprico y
estadstico significativo, se procede a la produccin
del material de evaluacin, la redaccin de un
manual tcnico (anlisis mtrico de los instrumentos) y
un manual del usuario (aplicacin e interpretacin de
las puntuaciones).
Estos manuales se hacen siguiendo los Estndares
para la Evaluacin Educativa y Psicolgica (APA,
AERA Y NCME. Gregory, 2012).

De igual modo, se procede a la obtencin de las


respectivas patentes intelectuales.

2. CONFECCIN DE LOS TEMS (Prat y Soval, 2003):


ESTRATEGIAS PARA LA GENERACIN DE TEMS.
2.1 Diseo de la Escala debe estar fundamentado en
que los tems cumplan las siguientes condiciones.
1. Estar relacionada con la CONDUCTA que se
pretende registrar y medir.
2. Representar todos los conceptos incluidos en
la definicin de la CONDUCTA.
3. Ser adecuados para la poblacin diana.

2.2 Una ESCALA puede CONSTRUIRSE a partir de:


1. tems originales o adaptados provenientes de
otras escalas diseadas con anterioridad.
2. tems construidos a partir de la opinin de
personas expertas sobre el comportamiento
(OBJETO) que se pretende registrar y medir.
3. tems generados a partir de ideas y opiniones
manifestadas por personas provenientes de la
poblacin diana.

4. tems generados a partir de ideas recogidas


de diversas fuentes de informacin relacionados
con la CONDUCTA:
- Libros

- Peridicos.
- Artculos cientficos o Papers.
- Eslganes

4. Evitar expresiones coloquiales y del argot


dado que slo seran comprensibles por ese
grupo y en un determinado tiempo.

5. Variar la direccin de la pregunta: Colocar


igual nmero de tems enunciados positiva y
negativamente.

2.3 Estrategias a seguir (Crocker y Algina, 1986):


1. ANLISIS DEL CONTENIDO: Definicin del constructo
(PARTE DEL REPERTORIO DE CONDUCTAS NO
OBSERVADO) requiere entre otras cosas realizar:

1. Preguntas abiertas a los sujetos a estudiar.


2. Agrupar respuestas por temas.
3. Temas recurrentes implican dimensiones
principales.

2. REVISIN BIBLIOGRFICA: Estudios previos que


definen el listado de conductas a observar.
3. INCIDENTES CRTICOS: Definicin de los extremos
del continuo.
CONDUCTA EMITIDA
Verbaliza Saludo con personas
desconocidas

CONDUCTA NO EMITIDA
No verbaliza Saludo con
personas desconocidas

Establece contacto visual directo Elude contacto visual directo con


con otra persona
otra persona
Finaliza una conversacin

Evita la conversacin

4. OBSERVACIN NATURAL: Identificar las conductas


mediante observacin directa.
Ejemplo: Registrar en Sala de Clases la cantidad de
golpes en cualquier parte del cuerpo que un nio le
da a otros. (Conducta de Agresin Fsica).

5. OPININ DE EXPERTOS: Sistemas expertos que


definen con mayor precisin el constructo.

6. OBJETIVOS DE LA INSTRUCCIN: Especificacin


de los objetivos que se busca medir.
7. MUESTREO DEL DOMINIO DEL TEM: Definir la
poblacin de tems de la cual se extraer una
muestra para formar el test.
8.
TABLA DE ESPECIFICACIN DE LOS TEMS:
construir variables latentes (CONDUCTAS NO
OBSERVADAS) en el mbito cognitivo y siguiendo la
taxonoma de Bloom.

NORMA ISO 10667 PARA INSTRUMENTOS


PSICOLOGA (Muiz y Fernndez-Hermida, 2010).

EN

- ISO: Sigla en ingls y que significa Organizacin


Internacional para la Estandarizacin (www.iso.org).
- Desarrolla normativas en todos sectores industriales
y de servicios.
INSTITUCIONES
CONSTRUCCIN:

PARTICIPANTES

EN

SU

1. Colegio Oficial de Psiclogos de Espaa (COP).


2. Asociacin Americana de Psicologa (APA).
3. Asociacin Britnica de Psicologa (BPS).

- Ser aplicable a:

1. Los procedimientos y mtodos utilizados a:


1.1 Nivel Individual:
Formacin.

Seleccin,

Consejo

1.2 Nivel Grupal: Clima y cohesin de equipos de


trabajo.
1.3 Nivel Organizacional: Clima laboral, cultura de
empresa, satisfaccin.

- Aspectos de la Norma: Se describen

1.Las competencias, obligaciones y responsabilidades


de los clientes y de los proveedores del servicio de
evaluacin, antes, durante y despus del proceso
evaluativo.
2. Proporciona directrices para todas las partes
implicadas en el proceso evaluador, incluida la propia
persona evaluada y quienes reciban los resultados de
la evaluacin.

3. Tiene como objetivo la REGULACIN DEL PROCESO


DE EVALUACIN DE LAS PERSONAS EN CONTEXTOS
LABORALES Y ORGANIZACIONALES.

- PROCESO DE EVALUACIN:

1. Establecimiento del Contrato de Evaluacin.


2. Metodologa de la Evaluacin .
3. Obtencin de los Resultados.
4. Anlisis de los Resultados.
5. Utilizacin de los resultados.

- INTERS PARA LOS PSICLOGOS: Esta nueva norma


lo es por algunas de las siguientes razones::
1. Papel Central en la evaluacin de personas en
contextos laborales.

2. Al ser vez aprobada las EMPRESAS E INSTITUCIONES


PODRN
CERTIFICARSE
garantizando
que
cumplen con la norma.
3. An no tiene rango legal (en sentido estricto),
pero,
constituye
una
importante
NORMA
REGULADORA DEL
MERCADO (Estar certificado no
es lo mismo que no estarlo).

2.4 ESCALAS DE VALORACIN:


- Escalas de categoras: Son tems que estn
A-. Formados por un enunciado.
B-. Formado por un conjunto de alternativas
organizadas (Secuencia u orden).
C-. Las categoras usadas expresan
muchos caractersticas de las conductas

2.4.1 Diseo de Investigacin: EXPLORATORIO


SECUENCIAL (Fase Derivativa. Ver en Hernndez
Sampieri, 2010)
FORMATO GENERAL

FASE CUALITATIVA

FASE CUANTITATIVA

1. Recoleccin Datos Cualitativos


(Grupos Focales)

1. Recoleccin Datos Cuantitativos


1.1 Estudio Piloto (Versin
Preliminar).

2. Anlisis Cualitativo (Indicadores,


Dimensiones Emergentes del
Constructo)

2. Anlisis Propiedades Mtricas


2.1 tems
2.2 Prueba
3. Ensamblaje Definitivo
3.1 Versin Final.

2.4.2 TIPOS DE ESCALAS (Levy y Varela, 2003)


LIKERT
Objetivo

THURSTONE

GUTTMAN

Escalar Personas

Escalar personas

Escalar Personas e tems

Supuesto sobre los tems

Hiptesis:
1. tems son homogneos
2. tems son formalmente
distintos
3. tems miden lo mismo

Hiptesis:
1. tems son diferentes
entre s
2. tems representan
niveles distintos del
atributo

Hiptesis:
1. tems son heterogneos.
2. tems representan niveles
distintos del atributo.

Papel de las Personas

Objeto Estudio: Diferencias


Personales

1.

Objeto Estudio: Diferencias


Personales

2.

Justificacin de los valores de


la Escala

Comprobar:
1. Respuestas son
coherentes (Medidas de la
conducta)
2. Si punto 1 se cumple,
entonces, tems se pueden
agregar para Escalar
Personas

Fase Escalamiento
tems: Personas
(jueces) constituyen
instrumento de medida.
Fase Dos: Estudio
diferencias
Individuales.

1. Fase 1: Comprobar
objetividad (acuerdo
entre ellos) respuestas
jueces (Permite escalar
estmulos).
2. Fase 2: Estmulos
Escalados permiten
Escalar Personas.

1. Escalamiento de Personas:
e tems: Coherencia de
Respuestas.
2. Cada respuesta en funcin
del nivel de la persona y del
que representa el tem.

2.4.3 ESCALA LIKERT: Permiten registrar

1-. EL GRADO DE ACUERDO O DESACUERDO CON EL


ENUNCIADO.
2-. Al Evaluado se le solicita POSICIONARSE
ACTITUDINALMENTE respecto de una idea, hecho u
objeto.
3. Se usan de forma intensa en Psicologa.
4. Son fciles de elaborar.

5. Se utilizan para medir actitudes.


6. Son confiables.
7. Funcionan mejor utilizando como ESCALA DE
RESPUESTAS 5 categoras
1 : APROBACIN DEL REACTIVO EN UN EXTREMO

5: APROBACIN DEL REACTIVO EN EL OTRO


EXTREMO

Ejemplo: ESCALA DE RESPUESTA de 5 categoras


1

Totalmente en
desacuerdo

En
desacuerdo

Ni de acuerdo
ni en
desacuerdo

De acuerdo

Totalmente de
acuerdo

- Segn De la Garza, Morales y Gonzlez (2013)

- En funcin de lo sealado por De la Garza, Morales y


Gonzlez (2013) los componentes de una Escala
Likert se operacionalizaran como:

COMPONENTES DE LA ESCALA
COGNITIVO

AFECTIVO

CONDUCTUAL

1. Resume informacin de la
persona sobre objeto
actitudinal
(comportamiento u
objeto de inters).

1. Sentimientos que una


persona tiene en relacin
a una conducta u objeto
de inters.

1. Representa las
EXPECTATIVAS (sealar
verbalmente por
adelantado cmo actuara
en el caso que algo
suceda) que una persona
tiene en relacin con su
comportamiento.

2. Creencias que tiene sobre


las caractersticas del
comportamiento u objeto
de inters

2. Preferencias que una


persona tiene en relacin
a una conducta de inters

2. Refiere a la INTENCIN
de accin (hace algo en
funcin de una
consecuencia anterior)
respecto al objeto de
inters

8. Se basa en los siguientes supuestos:

1. CONSIDERA LAS ACTITUDES COMO UN CONTNUO:


La probabilidad de respuesta de una persona es una
Funcin Montona con la posicin que la persona
ocupe en el Continuo Hipottico de Respuesta.

Probabilidad
Respuesta

Pa
Pb
Pc

Favorable

Actitud

2. Es posible estudiar las dimensiones de las


actitudes a partir de un conjunto de enunciados
que responden los sujetos.

3. Los individuos pueden situarse respecto de la


variable desde un punto de vista ms favorable o
desfavorable.

2.4.4 La VALORACIN de los sujetos en la variable:

3.1 NO supone una DISTRIBUCIN UNIFORME


SOBRE UN CONTINUO DE ACTITUD,
3.2
Supone
su
posicin
FAVORABLE
DESFAVORABLE SOBRE EL OBJETO ESTUDIADO.

2.4.5 PASOS PARA CONSTRUIR UNA ESCALA TIPO LIKERT:


1. Redacte el mismo nmero de oraciones favorables
y desfavorables respecto de los indicadores de las
conductas a observar.
2. Solicite a los evaluados que se POSICIONEN
ACTITUDINALMENTE para cada tem utilizando LA
ESCALA DE RESPUESTA
1

Totalmente en
desacuerdo

En desacuerdo

Ni en Desacuerdo
ni de Acuerdo

De Acuerdo

Totalmente de
Acuerdo

3. Recuerde que:

3.1 Los valores de esta escala como puntuacin sea


calificada entre dos extremos:
- Totalmente en Desacuerdo (1)
ITEM DESFAVORABLE

- Totalmente de Acuerdo (5)


ITEM FAVORABLE

4. Utilice una ESCALA SUMATIVA a partir de las


puntuaciones registradas para cada respuesta
con el fin de determinar los reactivos ms
discriminativos .

IMPLICANCIA
- Los tems registrarn con mayor probabilidad (de
manera global) puntajes ALTOS en aquellos
sujetos que tienen puntajes ms altos en la
variable y viceversa.

5. Rechace los reactivos con bajo poder


discriminativo manteniendo un equilibrio con los
reactivos favorables y desfavorables.
(Coolican, 1997)

2.6 NORMAS DE REDACCIN DE ENUNCIADOS:

1. Lenguaje utilizado (vocabulario y estructura de


frases) debe ser sencillo (simple, claro y directo)
y gramaticalmente correcto (respetar las reglas
oficiales del idioma espaol)
2. Los enunciados deben ser cortos (no ms de 20
palabras), redactados en tiempo presente (evitar
redactar en pasado y que se refieran a un solo
grupo) .
3. Deben contener una sola idea y relacionada con
el objeto actitudinal (El objeto de la actitud debe ser
el sujeto de la oracin del reactivo).

4. Deben ser especficos (evitar ambigedad y doble


significado), es decir, con una sola interpretacin
posible (interpretacin unvoca).
5. Expresar actitudes, preferencias, sentimientos o
creencias (en el presente), pero NO HECHOS sobre
los cuales tendran la misma respuesta.
6. Redactarse de manera favorable y desfavorable en
similar proporcin.

7. Deben evitarse palabras con significado genrico


(Universalidad) como:
Siempre, Nunca, Nadie, Ninguno, Todos
8. Deben evitarse palabras que tienen significado
indefinido como:
A veces
Apenas

9. Redacte 20 por cada actitud o dimensin.

10. No formule afirmaciones demasiado extremas.

11. Permita que quienes respondan indiquen su nivel


de acuerdo a la respuesta elegida.
12. Verificar que se califique la Escala de Respuesta
como:
Lado negativo:

Lado Positivo:

13. Seleccionar tems que puedan cubrir toda la


escala de Respuesta.

14. Las personas deben responder diferencialmente


(funcin monotnica el nivel actitudinal) , por lo que
se deben evitar los enunciados con los cuales todos
pueden estar de acuerdo.
15. Emplear moderadamente palabras como
Solamente,
nicamente
La mayor parte del tiempo.
16. Evitar doble negacin.

(Thurstone y Chave, 1929; Likert, 1932; Bird, 1940; Thorndike y Hagen, 1989, 2001;
Aiken, 2003, Cortada de Kohan, 1999, 2000, 2004; Prat y Doval, 2003; Cohen y
Swerdlik, 2006).

Ejemplo TEM 1: La caza de animales es buena.


1

Totalmente en
desacuerdo

En
desacuerdo

Ni de
acuerdo ni
en
desacuerdo

De acuerdo

Totalmente de
acuerdo

- CONDUCTA O VARIABLE DE INTERS?


- TEM FAVORABLE O DESFAVORABLE?
- EXISTE ESCALA DE RESPUESTA ?

Ejemplo TEM 2: Hara trampa en el pago de los


impuestos si tuviera la oportunidad.
1

Totalmente en
desacuerdo

En
desacuerdo

Ni de
acuerdo ni
en
desacuerdo

De acuerdo

Totalmente de
acuerdo

- CONDUCTA O VARIABLE DE INTERS?


- TEM FAVORABLE O DESFAVORABLE?

- EXISTE ESCALA DE RESPUESTA ?

Ejemplo TEM 3: Las mujeres tiene una necesidad


instintiva de estar cerca de su hijo durante los
primeros dos o tres aos de su vida.

Totalmente
en
desacuerdo

En
desacuerdo

Ni de
acuerdo ni
en
desacuerdo

De acuerdo

Totalmente de
acuerdo

- CONDUCTA O VARIABLE DE INTERS?

- TEM FAVORABLE O DESFAVORABLE?


- EXISTE ESCALA DE RESPUESTA ?

- Ejemplo:

AFIRMACIN: Acostumbro a sentir inters de ayudar


a otro cuando alguien me cuenta de sus problemas
REDACCIN
Favorable

Desfavorable

DIMENSIN
Cognitivo

Afectivo

Conductual

- Ejemplo: CONDUCTA EMPTICA

AFIRMACIN: Acostumbro a sentir inters de ayudar


a otro cuando alguien me cuenta de sus problemas
REDACCIN
Favorable

Desfavorable

DIMENSIN
Cognitivo

Afectivo

Conductual

- Ejemplo: CONDUCTA EMPTICA

AFIRMACIN: Acostumbro a sentir inters de ayudar


a otro cuando alguien me cuenta de sus problemas
REDACCIN
Favorable

Desfavorable

DIMENSIN
Cognitivo

Afectivo

Conductual

VALIDEZ DE CONTENIDO TEMS:

Ejemplo 1.1: Calcule el ndice de Validez de Contenido


de los 10 tems de la Escala de Honestidad evaluada
por 20 jueces expertos.
1.1 Calcule el ndice de Validez de Contenido con la
frmula

D
IVC
A B C D
(Marutza, 1977; Hambleton, 1984; Bausel; Gregory, 2012)

1.2 Seale el Tipo de Acuerdo, Relevancia y Decisin


respecto del ICV de cada tem.

Los 20 jueces expertos calificaran los tems con la siguiente escala:

REVISOR: ______________________________________

FECHA: _________

Por favor, lea con cuidado la especificacin de dominio para esta


prueba. A continuacin indique qu tan bien considera que el
reactivo refleja la especificacin del dominio. Juzgue el reactivo
nicamente con base en la correspondencia entre su contenido y el
contenido definido por la especificacin del dominio.
AFIRMACIN: Acostumbro a sonrojarme cuando tengo que hablar con
personas desconocidas.

Utilice la Escala de calificacin de cuatro puntos que se muestra a continuacin.

1.

IRRELEVANTE

_____________

2. BAJA RELEVANCIA

3. MODERADA RELEVANCIA

4. ALTA RELEVANCIA

_____________

_____________

_____________

Seale la Dimensin a la cul pertenecera la presente afirmacin.

COGNITIVO
_____________

EMOCIONAL
_____________

CONDUCTUAL
_____________

OTRA
_____________

Propuesta de Redaccin del tem (si lo estima del caso):

Adaptado de (Gregory, 2012)

- Una vez finalizada esta etapa se registraron los


siguientes resultados:

A
B
C
D

TEM 1

TEM 2

TEM 3

TEM 4

TEM 5

TEM 6

TEM 7

TEM 8

TEM 9

TEM 10

3
5
6
6

2
9
4
5

4
5
9
2

5
3
1
11

12
4
1
3

6
8
2
4

1
9
2
8

4
4
5
7

11
4
3
2

2
3
3
12

Interprete los valores obtenidos conforme a los rangos


sealados.
VALOR OBTENIDO
0.75 o MS

ACUERDO
Excelente

INTERPRETACIN
Alta Relevancia

0.60-0.74

Excelente

Alta Relevancia

0.40-0.59

Bueno

Moderada
Relevancia

0.39 o MENOS

Pobre

Baja Relevancia

DECISIN
Incorporarlo en
la Prueba (I)
Incorporarlo en
la Prueba (I)
Incorporarlo en
la Prueba previa
si el segundo
acuerdo de los
jueces es igual o
mayor que 0.60
(R)
Eliminarlo de la
Prueba (E)

Adaptado de (Pardo y Ruiz, 2002)

2.7 DEBILIDADES DE LA ESCALA LIKERT


1. Las puntuaciones en la escala slo tiene un
significado relativo (respecto a la Distribucin de los
datos de la conducta obtenida).

2. La puntuacin 3 (indeciso) es ambigua.


Implica una posicin neutral (ninguna opinin) o
una posicin indecisa en la que el respondiente se
encuentra dudando con sentimientos en ambas
direcciones?.

3. Las puntuaciones centrales de la distribucin


(entre percentil 30 a 60) son ambiguas.
NOTA 1: Podran reflejar muchas respuestas
indecisas o que podran comprender una
coleccin de respuestas totalmente a favor o
totalmente en contra.
NOTA 2: En esta situacin se podran estar
midiendo dos variables distintas.

4. Personas con una misma puntuacin pueden


tener pautas de respuesta diferentes.
5. No es posible tratar la calificacin como si
tuviera un significado nico.

2.8 IMPORTANTE
1. La Escala Likert es un tipo de escala de estimacin
y sus respuestas se registran en una Escala Ordinal.
2. Para tratar sus datos son como si estuvieran
medidos en una escala de intervalos se requiere
hacer un Contraste de Hiptesis acerca de la
Normalidad de las Puntuaciones.
(Cortada de Kohan 2000, 2004; Hernndez-Sampieri,
Fernndez-Collado y Baptista, 2006; 2010;
Tornimbeni, Prez y Olaz, 2008).

3. La puntuacin final de la prueba se obtiene


sumando las estimaciones de todos los reactivos
(ESCALA SUMATIVA).
4-. La puntuacin obtenida por los sujetos en la
escala est en funcin de los puntajes obtenidos
en cada tem.

2.9 Aspectos SE DEBEN EVITAR en la construccin de


los reactivos:
1 Ejemplo:
Deberamos empezar a tomar acciones compensatorias en
reas en donde, en el pasado, los miembros de un grupo
tnico, sexo o tipo de invalidez han sufrido discriminacin o han
experimentado desventajas como resultado directo de ser un
miembro de esa categora.

Analizar:
Es un tem favorable o desfavorable?
Qu errores detecta en la construccin?

Qu modificaciones le hara a la construccin?

Errores:
1.Complejidad: La oracin impide que se
comprenda que es lo que se est diciendo o
preguntando.
2. Ambigedad: La oracin se puede interpretar de
distintas maneras
3. Uso del trmino DEBERA.

SOLUCIN: Descomponer la frase lgicamente y


redactarla de manera simple, directa y usando
menos de 20 palabras.
Ejemplo:
Los miembros de distintos grupos tnicos dentro de un pas tendran
que acceder a los mismos derechos que los que los ciudadanos del
pas que habitan si es cuentan con permiso de residencia.

2. Ejemplo:

La sociedad debera comenzar a deshacerse del


racismo institucional siempre que sea posible.
Analizar:
Es un tem favorable o desfavorable?

Qu errores detecta en la construccin?


Qu modificaciones le hara a la construccin

Errores:

1. Trminos tcnicos: Muchos respondientes no


tendrn claro a que se est haciendo referencia.
2. Uso del trmino DEBERA.
SOLUCIN: Se tendr que encontrar otro trmino o
incluir un prembulo especial que lo explique.
Ejemplo:

Las reglas de la sociedad tendran que ser claras prohibiendo un trato


discriminatorio a las personas de raza diferente.

3. Ejemplo:

No debera permitirse a los inmigrantes


establecerse en reas de gran desempleo.
Analizar:
Es un tem favorable o desfavorable?

Qu errores detecta en la construccin?


Qu modificaciones le hara a la
construccin

Errores:
1. Ambigedad: Impide discriminar entre los que
manejan un contenido o conocimiento.
2. Introduccin de negacin.
3. Uso del trmino DEBERA.
SOLUCIN: Utilizar una frase con un solo sentido,
positiva y con lgica.
Ejemplos:
Los inmigrantes deberan tener posibilidades de empleo de acuerdo a
las competencias que tienen.
Los inmigrantes deberan tener posibilidades de empleo de acuerdo a
las necesidades del mercado.

4. Ejemplo:
El aborto es de manera exclusiva una opcin de la
mujer y debera de estar a su disposicin
gratuitamente.
Analizar:

Es un tem favorable o desfavorable?


Qu errores detecta en la construccin?

Qu modificaciones le hara a la
construccin

1. Reactivo de doble efecto: Se produce porque se


establecen dos preguntas o ideas en una misma
frase.
SOLUCIN: Utilizar una frase con una sola idea
redactada lgicamente.
Ejemplo:
El aborto es una decisin a la que puede optar la mujer.
El aborto debera de estar claramente legislado.

5. Ejemplo:
No debera ser posible preguntarle a una mujer
acerca del apoyo econmico que recibe de su
esposo, cuando a los maridos no se les hacen las
mismas preguntas.
Analizar:
Es un tem favorable o desfavorable?

Qu errores detecta en la construccin?


Qu modificaciones le hara a la construccin

Errores:

1. Negaciones: Puede resultar confuso responder una


pregunta con doble negacin porque cuesta
interpretar la respuesta.
2. Uso del trmino DEBERA.
SOLUCIN: Utilizar una frase con una sola idea y
redactada lgicamente.
Ejemplo:
Las mujeres merecen el mismo respeto que cualquier persona cuando
se les pregunta acerca del manejo de sus finanzas.

6. Ejemplo:

Las personas deberan pensar de unvocamente


en temas como el transporte, la educacin y la
salud.
Analizar:
Es un tem favorable o desfavorable?
Qu errores detecta en la construccin?

Qu modificaciones le hara a la
construccin

Errores:
1. Lenguaje emotivo: Provoca activacin de procesos
cerebrales que interfieren en la capacidad de
respuesta del sujeto.

2. Trminos o palabras desconocidas:


UNIVOCAMENTE
SOLUCIN: Utilizar una frase redactada objetivamente
y en trminos neutros.
Ejemplo:

Es muy probable existan diferencias frente a los temas que


importan a la sociedad.

7. Ejemplo:
Est usted de acuerdo con que deberan
aumentarse los subsidios a las personas de la
tercera edad?.

Analizar:
Es un tem favorable o desfavorable?
Qu errores detecta en la construccin?

Qu modificaciones le hara a la construccin

Errores:
1. Preguntas sugestivas: Sitan la respuesta en un
contexto donde la respuesta ms probable es
afirmativa.
Tienen la desventaja que muchas
preguntas con poco contenido real.
2. Uso del trmino DEBERA.

veces

son

SOLUCIN: Utilizar una frase redactada con


contenidos reales y que sea equiprobable la opcin
de responder.
Ejemplo:
Es necesario que las polticas de apoyo a la tercera edad
sean claras a fin de evitar recargar el aumento de los
impuestos a los contribuyentes.
Es necesario que las polticas de apoyo a jubilados sean
claras a fin de evitar recargar el aumento de los impuestos a los
contribuyentes.

8. Ejemplo:
Tiene usted antecedentes penales?.
Analizar:

Es un tem favorable o desfavorable?


Qu errores detecta en la construccin?
Qu modificaciones le hara a la
construccin

Errores:
1. Invasin de la intimidad: Son preguntas poco
pertinentes (vida privada o vida sexual), por lo
tanto la intromisin puede conducir a
incomodidad y a falsear la respuesta.
SOLUCIN: Evitar este tipo de preguntas.

ETAPAS CONSTRUCCIN TAIS

EJEMPLOS DE NUEVOS TEMS


INFORMATIZADOS (Muiz, 2011).

EN

CONTEXTOS

1. Highlighting Test, (Carey, 2001; Walker & Crandall, 1999)


Click on the sentence in the
paragraph to the left that best
describes the practical
meaning of the property of
invariance.
(Place the pointer on the
sentence you wish to
highlight, and click to select
it.)
\

Help

Previous

Next

Multiple Selection
Marco has $7.00 to spend on his lunch. Click on a drink, a
sandwich, and a side that Marco could have for lunch so that the
price of the three items adds up to $7.00 or less.
Drinks

Sandwiches

Sides

$1.25

Milk

$3.75

Veggie

$1.50

Chips

$.95

Tea

$4.50

Turkey

$1.00

Cookies

$1.50

Soda

$4.75

Roast Beef

$1.75

Rice

$1.25

Juice

$5.00

Pastrami

$1.50

Green Salad

$.95

Coffee

$4.75

Ham

$1.50

Fruit Salad

Inserting Text (Taylor et al., 1998)

Image courtesy of ETS/C. Mills (2000)

Highlighting Text
(Carey, 2001; Walker & Crandall, 1999)
Directions: Click on the one value in the number sentence below that must be
changed in order for the number sentence to be correct.

3+2+5 = 5+2+9 = 10
This is one way to allow students to
demonstrate understanding of the
commutative property of addition

Free-Response Mathematics
(Braswell & Kupin, 1993)

Note, a calculator can be accessed


by clicking on the icon.

Scores on two items for five examinees are given below. Complete the
table by computing the classical item difficulty for each of the items and
typing it into the highlighted boxes provided.

(You may use the calculator tool as needed.)


Examinees

Item 1

Item 2

Difficulty:

0.60

Difficulty:

0.80
CALC

BACK

NEXT

Graphical Modeling
(Bennett, Morley, & Quardt, 2000)
Directions: Use the information in the table below to finish the bar
chart. Drag the bar labeled Other Color to show the percent of
people in that category.
Eye
Color

Percent

Brown
Eyes

50%

Brown Eyes

Blue Eyes

Blue
Eyes

30%

Other
Color

20%
Other Color

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Computer-based essay
In the space provided,
please write an essay addressing the topic given below.

The earliest known evidence of testing dates back to


Chinese employment testing thousands of years ago. Today,
we are talking about computer-based testing and the Internet.
Briefly (yet completely) describe three of the major
As educational and
psychological tests have
found new
useshave
in
developments
in measurement
practice
that
takenCut
place
aspects of everyday life, such tests have evolved in many interesting and
inexciting
history.
ways from their earliest beginnings. Three critical advances that
have particularly changed measurement practices include (1) the test
development efforts related to the Army Alpha tests during the World War
I era, (2) the theoretical innovations associated with the
conceptualization of item response theory, and (3), the introduction of the
computer as a mechanism for delivering tests and recording examinee
responses. In this essay, I will detail how such changes have impacted

Paste
Undo
Submit

Graphical Modeling
(Bennett, Morley, & Quardt, 2000)

Image from ETS/C. Mills (2000)

Site Planning Vignettes (Bejar, 1991)

This example comes from a licensing exam for architects. They are
required to use computerized tools to build buildings, parking lots, etc.
Image from NCARB (2000)

Dynamic Problem Solving


(Clauser et al., 1997)

This item, from a licensing exam for medical doctors, requires


the examinee to order medical tests and treat the patient in
real time.
Results of medical tests are
obtained by advancing the clock.
Image from NBME (2001)

Precaucin con los nuevos formatos de los


tems
1. Ser muy claro acerca de los constructos medidos
2. Evitar sesgos

3. Aportar datos sobre la fiabilidad y validez


4. Prestar atencin a los aspectos prcticos
5. Controlar posibles entrenamientos

7. MODELOS DE LOS TEST:


7.1 MODELOS MATEMTICOS: Se aplican cuando NO
EXISTE CONTROL RIGUROSO y REGISTRO PRECISO de
todas las conductas de inters.

Las variables independientes (PARTE DE LA


CONDUCTA
NO
OBSERVADA)
se
combinan
numricamente para predecir una variable
dependiente
(PARTES
DE
LA
CONDUCTA
OBSERVADA).
7.2
REGLAS
FORMALES
EXPLCITAS:
Integrar
informacin para una inferencia psicomtrica.

5. FUENTES DE ERROR EN EL PROCESO DE MEDICIN


5.1 VARIANZA DEL ERROR (Error).
DEFINICIN: Es el componente de puntuacin de
una prueba atribuible a fuentes distintas del
comportamiento medido (CONDUCTA REGISTRADA).
(Cohen y Swerdlik, 2006)

- Este planteamiento asume:


4.1.1 HAY FACTORES que
puntuaciones de la prueba.

influirn

en

las

4.1.2 Los FACTORES son AJENOS a lo que la


prueba pretende medir

- Existen muchas fuentes potenciales de varianza


de error, a saber:
1. El evaluado se encuentra enfermo
momento de responder una prueba.

al

Evaluado como fuente de error

2. El nivel de profesionalismo de los evaluadores


al conocer y aplicar la regla conforme a las
instrucciones de la misma.
Evaluador como fuente de error

3. Algunas pruebas son mejores que otras (calidad


tcnica) para medir lo que pretenden medir.
Ejemplo: El WAIS III es una prueba mejor que el
Rorschach para evaluar la inteligencia de los adultos.
Instrumento de medicin como fuente de error

Las puntuaciones de las pruebas siempre estn


sujetas a preguntas sobre el grado en que el proceso
de medicin incluye el error.

6. COLOCANDO A PRUEBA UN INSTRUMENTO:


Permite:
1. Responder preguntas.
2. Observar empricamente el impacto que sobre los
principios del modelo psicomtrico sobre:
- La construccin del Test.
- El uso posterior del Test

PREGUNTAS A QU RESPONDE:
1. Por qu usar este instrumento o mtodo en
particular ?.
2. Se ha publicado alguna gua sobre el uso de
esta prueba ?.
3. Es confiable este instrumento ? y Es vlido este
instrumento ?.

4. Sus medidas son comparables para diferentes


sujetos?. Se consideraron las variables
contextuales asociadas a la evaluacin y los
evaluados?.
5. Qu inferencias se pueden hacer de manera
razonable a partir de la calificacin de esta
prueba, y qu tan generalizables son los hallazgos
?.

7.3 BASADO EN PROBABILIDADES:


7.3.1 Establecer las relaciones entre las conductas no
observadas () y las conductas observadas (X).
7.3,2 Se DESCONOCE la manera en los sujetos que van
a responder a los tems.
7.3.2 Existir una distribucin de probabilidad de
valores con una valor dado de :
P (X )
NOTA: LA PARTE DE LA CONDUCTA NO OBSERVADA SE INFERIR A
PARTIR DE PARTE DE LA CONDUCTA OBSERVADA

7.4 Modelo de Medida:


7.4.1 No intenta explicar cada detalle de los
datos (tomados a partir de conductas
observadas)

7.4.2
Intenta
aproximar
patrones
de
comportamiento importantes o relevantes
(REPERTORIOS DE CONDUCTA EN TRMINOS
GENERALES).

7.5 Aspectos que deben ser considerados en el


Modelo:
7.5.1. Especificar la escala para las observaciones
(CONDUCTA REGISTRADA) en funcin de:
1. Una puntuacin.
2. La respuesta a un tem.
3. Una matriz de relaciones entre tems y
respuestas.

7.5.2. Especificar una o ms variables del diseo


(CONDUCTAS NO OBSERVABLES).
7.5.3 Especificar la combinacin entre las
variables independientes para predecir la
variable
dependiente
(CONDUCTAS
OBSERVABLES).

Aspectos que .. (continuacin):

7.5.4 LOS PESOS ESTADSTICOS de las variables del


diseo son los parmetros del modelo.
Especificar las relaciones entre PARTES DE LA
CONDUCTA OBSERVABLE Y NO OBSERVABLE

8. Modelos Bsicos en la Construccin de los Test:


8.1 Aplicacin en funcin de:
1. La Complejidad de los Problemas de Medida.

2. Evaluaciones a gran escala (EGE).

8.2 Teoras de los Test:


TCT

TG

TRI

Autores

Speraman

Cronbach

Lord y Novick

Estimacin
Caracterstica Inters

X= V+e

Funcin Matemtica

Lineal

P (u

1 )

i 1

Error tpico de Medida

ANOVA

Logstico y de Ojiva
Normal

Faceta

1 I

x 1 rxx

Fuentes de Error (Variancia


Verdadera, Dificultad del tem,
Interaccin, Aleatorio)

Supuestos

Normalidad
Homocedasticidad
Independencia

Normalidad
Homocedasticidad
Independencia

Unidimensionalidad
del test
Indeterminacin de la
Escala de Rasgo
Latente
Independencia Local

Parmetros

Discriminacin
Dificultad

Puntuacin del
Universo

Dificultad
Discriminacin
Pseudo adivinacin

ESQUEMA ELEMENTOS DE LA MEDICIN

OBJETO

PROPIEDAD
OBSERVABLE

Sistema Fsico sobre el que


se realizan una serie de
operaciones

Valor determinado por la


operacin

INSTRUMENTO
Permite llevar a cabo la
operacin

CUADRO n1: COMPARACIN TEORAS DE LA MEDICIN


CONCEPCIN

CARACTERSTICAS

Conservadora
(PRE-CLSICA,
CLSICA)

Axiomas de la Cantidad
Manipulacin Matemtica
es a Manipulacin Fsica.
Representacin emprica
mediante PROPIEDADES
REALES.

Directa / Fundamental
Propiedades Extensivas

Psicologa: UNIDAD DE MEDIDA


CONDUCTUAL (Psicologa
Neoconductista de Skinner)

- Psicologa: ESTRICTAMENTE
EMPRICA ( Psicologa
Neoconductista. de Skinner)

Psicologa: Sustituir la
RESTRICCIN DE LA ADITIVIDAD
EMPRICA (adherencia a reglas
aritmticas) por la ASIGNACIN
MEDIANTE REGLAS (niveles de
medida reemplazan a la
concatenacin)

- Escalas de Medida de Stevens


(PRINCIPIO DE LA
INVARIANZA)

Liberal
(REPRESENTACIONAL)

MEDICIN

(Aditividad Emprica)
Derivada / Indirecta
Propiedades Intensivas

(Sin Aditividad Emprica)

Por ndices: Definicin


arbitraria sobre la base de
observaciones empricas.

CUADRO N2
Aspecto

Teora Tradicional

Teora Representacional (Stevens)

Aspecto Previo y al margen de la


teora
Medicin sobre propiedades de
cosas
Nmeros corresponden a
magnitudes

Teora y Medicin conforman Binomio


Inseparable
Lo medido es un objeto en si mismo, no una
propiedad de ste
Los nmeros corresponden a objetos o
eventos

Magnitudes
Propiedades Objetos Materiales
Expresada en cantidades de las
propiedades de un sistema
No se miden atributos

Ampla concepto de medicin


Considera magnitudes y atributos

Magnitudes extensivas
e intensivas

Medida Fundamental slo es


posible en magnitudes extensivas
Leyes de cantidad son necesarias
Constatacin emprica de la
concatenacin
Magnitudes intensivas no se
pueden medir fundamentalmente

La distincin entre cantidades extensivas e


intensivas deja de ser un problema
Supera restricciones de la concatenacin
(requisitos de aditividad)
Propone medicin fundamental de
magnitudes intensivas (no necesita leyes de
aditividad para medir fundamentalmente)

Escalas de Medida

Ordenacin y cuantificacin de
sistemas materiales
Nivel mnimo de medidas
corresponde a ordenacin de
objetos
Escalas de Medida: SOLO EXISTIRA
DE RAZN

Ampla rango de medidas a


Transformaciones de Sustitucin Biunvocas
Escalas: Nominal, Ordinal, De Intervalos
Razn

Teora y Medicin

Naturaleza de lo
medido

CUADRO N3: AXIOMAS DE LA MEDICIN RESUMIDOS


POSTULADOS

PROPIEDADES DE RELACIN Y
DE LOS NMEROS

IDENTIDAD:
1. a = b o a b. (REFLEXIVIDAD)
2. a = b ,entonces, b = a (SIMTRICA)
3. a = b y b = c, entonces , c = a. (TRANSITIVIDAD
ORDEN JERRQUICO:
4. a > b , entonces , b > a (ASIMETRA)
5 . a > b y b > c, entonces, a > c (TRANSITIVIDAD)

IDENTIDAD LGICA

MAYOR O MENOR QUE


(N: ORDEN)

1-5: CONJUNTO ORDENADO

ADITIVIDAD:
6. Si a = p, b > 0, entonces , a + b > p (CONCATENACIN.
Posibilidad de Sumar)
7. a + b = b+ a

(CONMUTATIVIDAD)

8. a = p y b = q, entonces, a + b = p + q
(ESTABILIDAD DE LA RELACIN)
9. (a + b) + c = a + (b + c). (ASOCIATIVA)

ELEMENTO NEUTRO
(N: ORIGEN)

CONMUTATIVIDAD
(N: DISTANCIA)

ESTABILIDAD
(N: DISTANCIA)

ASOCIATIVIDAD
(N: DISTANCIA)

6-9: ADITIVIDAD O CONCATENACIN

FORMATO
- Elementos del PROTOCOLO:
1. Las instrucciones para la administracin.
2. Antecedentes de los evaluados.
3. La modalidad de Registro de las Respuestas.
4. El tiempo de duracin.

Asociado a lo anterior: CONDICIONES DE APLICACIN


Estandarizacin de Condiciones: Disposicin de medios
y fines en iguales para los diferentes grupos.
1. Entrega de instrucciones.
2. Espacio Fsico con variables de luz, temperatura.
3. Tiempo de Respuestas

4. Condiciones de los sujetos que responden:


Capacidad de lectura y comprensin lectora entre
otras.

LONGITUD:
1. Nmero de tems total de la Escala.
2. Nmero de tems por factor o dimensin.
3. Escala de Respuestas de los tems
(Registro).
4. Escala de Puntuacin individual y/o
Grupal.
NOTA: Evitar escalas con muchos tems para
evitar cansancio y fatiga, as como tambin,
errores en las respuestas.

- INDICADORES PSICOMTRICOS EN EL TEST:


1. Propiedades Psicomtricas de los tems.

- Fiabilidad.
- Validez.
- Discriminacin.
2. Propiedades Psicomtricas de la Prueba:
- Tipo de Fiabilidad
- Tipos de Validez

You might also like