s1 Pi Usach 2014-A (Subrrayado)

SESIN N1: PSICOMETRA I
1.
2.
3.
4.
5.
6.
Introduccin: Definicin de Instrumentos o Pruebas

Psicolgicas.
Etapas en la Construccin de una Prueba.
Fuentes de Error en el Proceso de Medicin.
Poniendo a Prueba los Test .
Los modelos de los test.
Modelos Bsico en la Construccin de los Test.
Qu es la Ciencia?
Objetivos
Describir, Explicar, Predecir, Controlar
La Psicologa
es una Ciencia?
DIMENSIONES DE LAS
ESTRATEGIAS
1.
Diseo
2.
Ambiente
3.
Recopilacin de
los datos
Caractersticas
Lgica, Determinista, General, Parsimoniosa,

Especfica, Emprica, Intersubjetiva, Pblica
Modalidades investigacin
en Psicologa
METODOLOGA EXPERIMENTAL
HIPTESIS CAUSALES
DISEOS EXPERIMENTALES - CUASI EXPERIEMNTALES
Manipulativo-Experimental
Asociativo Correlacional
Mtodo Cientfico
Fases investigacin
Planteamiento Problema
Formulacin Hiptesis
Eleccin Metodologa
OPERATIVIZACIN VARIABLES
MEDICIN VARIABLES
EVALUACIN MTRICA INSTRUMENTOS*
Seleccin muestra
Recogida de los datos
Anlisis de datos
Contrastacin Hiptesis
Interpretacin resultados
Reporte de investigacin
METODOLOGA NO EXPERIMENTAL*
HIPTESIS DE COVARIACIN
DISEOS NO EXPERIMENTALES
1.
INTRODUCCIN: Meta de las Ciencias

Comportamiento
es
el
ESTABLECIMIENTO
PRINCIPIOS GENERALES para:
del
DE
1. DESCRIBIR.
2. EXPLICAR.
3. PREDECIR
IMPLICA: Recoger y comparar datos (MEDICIN).

Ejemplo: Estudios de Fester y Skinner (1957) hechos
sobre el registro de UN CUARTO DE BILLN DE
RESPUESTAS.
- La rama que se dedica a LOS PROCESOS DE

MEDICIN en Psicologa es la Psicometra.
1.1 DISCIPLINA
vertiente:
1. Terica
METODOLGICA
con
una
doble
: Fundamentacin terica de la
medida.
2. Prctica : Construccin, evaluacin y

aplicacin de instrumentos de
medida para EVALUAR o MEDIR
CONDUCTAS.
(Escudero y Prez-Gil, 2007).
Comportamiento Humano
OBJETO
ESTUDIO
Psicologa
como
Ciencia
(Objeto con caractersticas

particulares)
1. Precisa de aspectos
especficos.
2. Precisa de tcnicas e
instrumentos de medicin
diferentes
MEDICIN EN
PSICOLOGA
3.
Qu
es
medir?:
Establecer
correspondencia entre un conjunto particular
de elementos reales y otro de elementos
formales.
* ROL TRADUCTOR AL EXPRESAR DIFERENTES
FENMENOS PSICOLGICOS EN LENGUAJE
FORMAL Y UNIVERSAL*
4. Medir lo Psicolgico:
Consideracin
de constructos o caractersticas latentes (no
observables directamente).
*RELACIONAR CONCEPTOS ABSTRACTOS CON
INDICADORES EMPRICOS*
**NDICES ESTADSTICOS
1. OBSERVAR
UNA
CONDUCTA
2. CONSTRUCTO
11. DEFINICIN
OPERACIONAL
2.1 DEFINICIN
CONCEPTUAL
10. ANLISIS
COMPLEMENTARIOS
(TEST)
2.2
DIMENSIONES
3. INDICADORES
4.1 ESTRUCTURA
FACTORIAL
TERICA
4.2 ANLISIS
VALIDEZ
CONTENIDO
(JUECES
EXPERTOS)**
5. PRUEBA
PILOTO
(MUESTRA No
Objetivo)
9. ANLISIS **
PUNTUACIONES
TEMS Y DE LA
PRUEBA
(Propiedades
Mtricas)
8. APLICACIN
PRUEBA (MUESTRA
Objetivo)
4. ITEMS
7. SELECCIN
PRELIMINAR DE LOS
ITEMS **
6. ANLISIS
**PUNTUACIONES
DE LOS ITEMS
(Propiedades
Mtricas)
1.2 .DEFINICIN
PSICOLGICAS:
DE
INSTRUMENTOS
PRUEBAS
1.2.1 Prueba Psicolgica:

Es un procedimiento
estandarizado para obtener una muestra de conducta
y describirla con base en categoras o puntuaciones
(normas o estndares) que permiten utilizar los
resultados para predecir otras conductas.
(Gregory, 2012).
1.2.1.1 Caractersticas de las pruebas (Gregory, 2012):

1. Procedimientos Estandarizados.
2. Muestra de Conducta.
3. Permite obtener puntuaciones o derivar

categoras.
4. Contemplan Normas o Estndares.
5 Predicen conductas no evaluadas.
1.2.1.1 Caractersticas de las pruebas (Gregory, 2012):

1. Procedimientos Estandarizados: Implica que los
procedimientos de aplicacin de la prueba son
uniformes de un examinador a otro y de una situacin
a otra.
- Implica en parte las habilidades del evaluador.
- Depende principalmente de las instrucciones de

aplicacin.
- Presentar materiales con estmulos similares a
todos
los
aplicadores
(psicometristas
o
evaluadores).
- Aconsejar al evaluador o examinador sobre la
forma de manejar diversas dudas del examinado.
2. Muestra de Conducta: Es una muestra limitada de

conductas dado que existen RESTRICCIONES
PRCTICAS (el evaluado y el examinador no tienen
tiempo suficiente) para una prueba realmente
detallada de un dominio conductual bien definido y
finito.
- La muestra de conductas es de inters en la
medida que permite hacer inferencias acerca del
dominio relevante de conductas.
Ejemplo: Se le aplica a un adulto la Escala de

Inteligencia de Adultos IV (WAIS-IV) y es capaz de
definir 35 palabras de una sub prueba de
vocabulario.
Aplicacin:
Consecuencias directas: Es un puntaje alto en la sub
prueba.
Significado Indirecto:
general del evaluado.
El nivel de conocimiento
Cuestin Esencial: Permite predecir conductas que

no se evalan directamente.
3. Permite obtener puntuaciones o derivar categoras:

- Las pruebas psicolgicas resumen el desempeo de
los evaluados en nmeros y, posteriormente los
clasifican.
- En trminos psicomtricos, las pruebas miden

diferencias individuales respecto a rasgos o
caractersticas, las cuales, estn presentes en
diferente cantidad.
Dos advertencias:
1 Toda puntuacin de la prueba reflejar SIEMPRE
cierto grado de ERROR DE MEDICIN.
- La IMPRECISIN de las pruebas es INEVITABLE.

- Las Pruebas deben basarse en una MUESTRA
EXTERNA
DE
CONDUCTAS
para
ESTIMAR
(paradjicamente) una CONDUCTA NO OBSERVABLE
(inferida).
- La TCT la expresa con la ecuacin X = V e
donde;
X= Es la puntuacin observada.
V = Es la puntuacin verdadera
e = Componente de error positivo o negativo.
- Un Psicmetra y, posteriormente un evaluador

tratar que el error sea muy pequeo aunque, nunca
se puede eliminar por completo ni esa posible
conocer su efecto exacto sobre el caso individual.
2 Los resultados de un test representan una
ABSTRACCIN DE LA CONDUCTA OBSERVADA , la
cual, ha demostrado ser til para PREDECIR
CONDUCTAS QUE NO SE EVALAN.
- Evitar materializar las caractersticas medidas dado

que el Modelo Predictivo est formalizado mediante
un Modelo Estadstico, a saber: P (X )
donde: = Conducta No Observada y X = Conducta
Observada.
4. Contemplan Normas o Estndares: La puntuacin de

un sujeto en un test es interpretada al COMPARARLA
con las puntuaciones obtenidas por otros individuos en
el mismo test.
- Los Psicmetras (Diseadores y Constructores de
Pruebas)
comunican
las
NORMAS
(CRITERIOS
ESTADSTICOS), las cuales, son un resumen de los
resultados obtenidos en un grupo grande y
representativo de sujetos (GRUPO NORMATIVO es una
MUESTRA DE ESTANDARIZACIN), la cual, permite
determinar la posicin del evaluado con referencia a
l.
NORMAS: Establecen desempeo promedio e indican
la frecuencia con que se obtienen distintos puntajes.
5 Predicen conductas no evaluadas:
- La prueba no es un fin en si misma.

- Es importante conocer el desempeo en las
conductas que la prueba mide, as como tambin,
en conductas que a partir de ellas se pueden
hacer predicciones.
Ejemplo: Al conocer los niveles de CI de una
persona es posible hacer predicciones sobre el
rendimiento cognitivo.
1. 2.2 Variables de los Instrumentos:

1. Contenido.
2. Formato.
3. Aplicacin.
4. Puntuacin.
5. Calidad Tcnica.
(Cohen y Swerdlik, 2006)
1.2.3 Contenido: Refiere a los temas de la prueba.

- Varan segn el enfoque terico
maneje.
que la misma
Ejemplo: Personalidad.
- Los reactivos de una prueba de personalidad a

partir de la teora Psicoanaltica tiene poco parecido
a la prueba basada en la Teora Existencial.
- Ambas son pruebas de Personalidad.
Formato: Refiere a
1. Forma
2. Plan:
3. Estructura: Protocolo de la Prueba.
4. Arreglo o disposicin de los reactivos.

5.Consideraciones especficas: Registro de
respuesta, instrucciones y lmites de tiempo.
6. Computarizada o de lpiz y papel.
Procedimiento de aplicacin:
1. Evaluacin Individual.
2. Evaluacin Grupal.
3. Rol del Evaluador:
3.1 Presente (Hetero aplicacin)

3.2 Ausente (Auto aplicacin).
2.2.4 Puntuacin:
1. Proceso sumatorio de los puntos.
2. En funcin de las respuestas de un sujeto en el
desempeo de una prueba o tareas.
3. Opciones de respuesta:
3.1 Desacuerdo hasta Acuerdo.

3.2 Presente - Ausente
4. Categorizacin de respuestas: Uso de Puntos de
Corte (Mediana u otro criterio).
Calidad Tcnica:
1. Refiere al SONDEO PSICOMTRICO de una prueba.
2. Implica: Consistencia y Precisin de las puntuaciones de la
prueba.
3. FIABILIDAD:
3.1 Consistencia de las Puntuaciones.

3.2 Error No Sistemtico.
3.3 Responde a la pregunta de investigacin
Con cunta exactitud la muestra de tems o tareas
representa al universo de tems desde donde fueron
seleccionados?
PERSPECTIVAS TERICAS (Navas, 2001)

Teoras
Generalizabilidad
(TG)
Teoras
Clsica
Test (TCT)
2
Aplicaciones
Test
1.
2.
1 Aplicacin
Test
ESTABILIDAD
TEMPORAL
CONSISTENCIA
INTERNA
Test-Retest
Formas
Paralelas
1.
2.
Dos mitades
Alpha
Cronbach
Teora de la
Generalizabilidad
Teora
Respuesta
tem (TRI)
Informacin
Acuerdo
Interjueces
Consistencia
de las
clasificaciones
ESTUDIO DE LA FIABILIDAD TCT (Doval, 2002)
Ms de una
aplicacin del
instrumento
ESTABILIDAD
Formas Paralelas
Test- Retest
Coeficientes de
Equivalencia
(Entre-evaluadores)
Coeficientes de
Estabilidad
(Intra-evaluadores)
PROCEDIMIENTO
PROCEDIMIENTO
1. Coeficiente de
Fiabilidad con
r de Pearson
1. Coeficiente de
Fiabilidad con
r de Pearson
Una nica aplicacin del

instrumento compuesto por k
unidades
CONSISTENCIA INTERNA
Dos mitades
K-partes
Coeficiente de dos
Mitades
Coeficiente de
consistencia interna
PROCEDIMIENTOS
PROCEDIMIENTOS
1. Ruln
2. Spearman Brown
3. Gutmann
1. Alpha Cronbach
2. KR -20
3. KR-21
4. VALIDEZ:
4.1 Precisin de las puntuaciones.
4.2 Error Sistemtico.
4.3 Responde a la pregunta de investigacin:
Con qu fidelidad corresponde este universo al

atributo latente que se va a medir?
1.1 PROPIEDADES PSICOMTRICAS
FIABILIDAD: Grado de
consistencia de una medida.
Tipos:
1. Ms de una Aplicacin:
ESTABILIDAD
1.1 Formas Paralelas.
1.2 Test-Retest.
2. Una nica aplicacin:
CONSISTENCIA INTERNA.
2.1 Dos mitades.
2.2 K-partes.
Validez: Grado en el que el instrumento de

medicin con exactitud el constructo terico
para el que fue diseado.
TIPOS:
1. Contenido : Aparente, Muestral y Curricular.
2. Constructo : Convergente, Discriminante,
Factorial.
3. Criterial
: Predictiva, Concurrente,
Retrospectiva.
Ejemplo Coeficiente de Fiabilidad mediante Formas

paralelas: Un psicmetra se encuentra interesado en
conocer la fiabilidad de una Prueba de Ansiedad
que ha construido con dos formas (A y B). Para tal
efecto, administra a 10 pacientes seleccionados al
azar por un psiclogo clnico
encuentra los
siguientes resultados:
Matriz de Datos:
Pacientes
X
(Forma A)
Y
(Forma B)
19
39
11
13
28
20
39
29
29
10
23
24
11
14
12
37
26
FRMULAS COEFICIENTES DE FIABILIDAD

ESTABILIDAD
2 APLICACIONES
FORMAS PARALELAS
S xy
rxy
Sx S y
CONSISTENCIA INTERNA
2 MITADES (1 APLICACIN)
MTODO DE RULN
p i 2
n
rvx 1
X2
TEST-RETEST
S xy
rxy
Sx S y
1 APLICACIN
ALPHA DE CRONBACH
p i
X
n
SPEARMAN BROWN
rSB
N 1
2
S
i
S t2
KUDER RICHARDSON 20
2
N t pq
KR20
N 1
t2
kr0
1 (k 1)r0
GUTMANN
S12 S 22
rG 21
2
S
t
KUDER RICHARDSON 21
N x (n x )
KR21
2
N 1
n x
- Frmula Coeficiente
Paralelas:
rxy
de
Fiabilidad
Formas
n X iYi X i Yi
n X X i n Yi Yi
2
i
1.
ANLISIS DE LA RELACIN:
1.1 Tipo de Relacin.
1.2 Valor del Coeficiente de Correlacin.
1.3 Patrn de Correlacin.
1.4 Criterio de Clasificacin (descriptor del valor de
rxy) e Interpretacin Coeficiente Correlacin.
1.5
Error
Tpico
(Desviacin
Estndar
del
Coeficiente)
1.6 Varianza Explicada (Proporcin y Porcentaje).
1.7 Varianza No Explicada (Proporcin y
Porcentaje).
1.8 Covarianza y Comprobacin rxy
- CRITERIOS DE CLASIFICACIN COEF. CORRELACIN

(Prez, Garca. Gil y Galan,2009):
Valor Coeficiente
Interpretacin
1.00 - 0.91
Correlacin Muy Alta (Muy

elevada)
0.90 - 0.71
Correlacin Alta
(Elevada)
Correlacin Media (Marcada,
Notable)
0.70 - 0.41
0.40 - 0.21
0.20 -
0.00
Correlacin Baja
Correlacin Muy Baja
- Integracin de Rangos Interpretacin Coeficientes de

Fiabilidad (Nunally, 1978; Magnusson, 1983; Thorndike,
1989; Carretero-Dios, 2007; EFPA, 2011).
Rangos
Magnitud
Campo
Aplicacin
MODELO EFPA
(Muiz, 2011)
0.81-1.00
Muy Alta
(ACEPTABLE)
Decisiones
Importantes Personas
(0.90 o ms)
r > 0.90
(EXCELENTE)
Comparacin de
Grupos (0.80 o ms)
0.80 < r < 0.90

(BUENA)
0.70 < r < 0.80

(ADECUADO)
0.61-0.80
Alta
(ACEPTABLE)
0.41-0.60
Moderada
0.21-0.40
Baja
0.00-0.20
Muy Baja
Investigacin
(0.70 o ms)
r < 0.70
(INADECUADO)
2. ANLISIS INFERENCIAL:
2.1 Hiptesis Estadsticas.
2.2 Diagrama Contraste.
2.3 Conclusin Breve.
2.4 Clculo Error Estndar de la Medicin (Error
Psicomtrico).
2.5 Clculo Intervalos de Confianza.
2.6 Clculo de Longitud de la Prueba (en caso de
ser necesario).
2.7 Clculo Error Muestral (Error Estadstico)
CONTRASTE DE HIPTESIS:
1. Hiptesis Nula
H0 : 0
(No hay relacin estadsticamente significativa entre las

puntuaciones de las Formas A y B).
2. Hiptesis Alterna H1 : 0
(Hay relacin estadsticamente significativa entre las
FRMULA :
t
rxy
obs
n2
2
1 rxy
Construccin de los Intervalos de Confianza:
1 Fcrtico rxy 1 Fcrtico

rlmite inf erior
1 Fcrtico 1 Fcrtico rxy
rlmite sup erior
NOTA: En estas ecuaciones rxy es el coeficiente de
correlacin de la muestra y F es el valor crtico en funcin de
los grados de libertad (n-2) y un error permitido mediante .
(Blair y Taylor, 2008).
ERROR ESTNDAR:
EEM Sp 1 rF
donde:
EEM = Error estndar de medicin
Sp = Desviacin estndar de las puntuaciones
totales del test
r F = Coeficiente de Fiabilidad
Para clculo de Sp utilice la frmula:
Sp
nx 1 sx2 ny 1 s y2
nx 1 ny 1
Para clculo de Sp utilice la frmula:
Sp
nx 1 sx2 ny 1 s y2
nx 1 ny 1
1-. Calcule cul debera ser la longitud de la prueba

(nmero de tems que debera tener) para alcanzar
un nivel de fiabilidad de 0.70, 0.80 y 0.90.
Utilice la Frmula:
Rxx 1 rF
N
rF (1 rF )
donde:
Rxx= Es el coeficiente de Fiabilidad que se espera
alcanzar.
rF = Es el coeficiente de fiabilidad obtenido.
1 = Constante.
2-. Clculo de tems esperados (n):

donde:
n N n
n = nmero de tems que tenda el test

n = nmero de tems que tiene el test actualmente
N = Razn obtenida entre la fiabilidad esperada y la
fiabilidad obtenida.
ERROR MUESTRAL PARA MUESTRAS FINITAS (n<100,000)
EM
2
z p q
n
TAMAO MUESTRAL PARA POBLACIONES INFINITAS

(n>100,000)
2
z p q
Ejemplo Coeficiente de Validez Convergente: Un

psicmetra se encuentra interesado en conocer la
validez mediante el uso de un criterio externo de
una Prueba de Ansiedad que ha construido. Para tal
efecto, administra a 10 pacientes seleccionados al
azar por un psiclogo clnico la prueba que l ha
construido (variable X) y una prueba que otro
investigador ha construido para medir la ansiedad y
encuentra los siguientes resultados:
Matriz de Datos:
Pacientes
X
(Test Investigador)
Y
(Test del Otro Investigador )
15
37
34
33
22
36
11
11
10
20
15
12
25
16
31
40
10
11
10
34
12
37
32
- Frmula Coeficiente de Validez Convergente:
rxy
n X iYi X i Yi
n X X i n Yi Yi
2
i
1.
ANLISIS DE LA RELACIN:
1.1 Tipo de Relacin.
1.2 Valor del Coeficiente de Correlacin.
1.3 Patrn de Correlacin.
1.4 Criterio de Clasificacin (descriptor del valor de
rxy) e Interpretacin Coeficiente Correlacin.
1.5
Error
Tpico
(Desviacin
Estndar
del
Coeficiente)
- CRITERIOS DE CLASIFICACIN COEF. CORRELACIN

(Prez, Garca. Gil y Galan,2009):
Valor Coeficiente
Interpretacin
1.00 - 0.91
Correlacin Muy Alta (Muy

elevada)
0.90 - 0.71
Correlacin Alta
(Elevada)
Correlacin Media (Marcada,
Notable)
0.70 - 0.41
0.40 - 0.21
0.20 -
0.00
Correlacin Baja
Correlacin Muy Baja
Coeficiente de Validez:
Correlacin Test-Criterio (Muiz, 2011)
SIGNIFICACIN
VALOR COEFICIENTE
CORRELACIN
INADECUADA
r < 0.20
ADECUADA
0.20 < r < 0.35
BUENA
0.35 < r < 0.50
EXCELENTE
r > 0.50
Validez Convergente: Correlaciones con escalas

similares (Muiz, 2011)
SIGNIFICACIN
VALOR COEFICIENTE
CORRELACIN
INADECUADA
r < 0.55
ADECUADA
0.55 < r < 0.65
BUENA
0.65 < r < 0.75
EXCELENTE
r > 0.75
2. ANLISIS INFERENCIAL:
2.1 Hiptesis Estadsticas.
2.2 Diagrama Contraste.
2.3 Conclusin Breve.
2.4 Clculo Error Estimacin del Criterio (Error
Psicomtrico).
2.5 Clculo Intervalos de Confianza.
2.6 Clculo de Longitud de la Prueba (en caso de
ser necesario).
2.7 Clculo Error Muestral (Error Estadstico)
CONTRASTE DE HIPTESIS:
1. Hiptesis Nula
H0 : 0
(No hay relacin estadsticamente significativa entre las

2. Hiptesis Alterna H1 : 0
(Hay relacin estadsticamente significativa entre las
FRMULA :
t
rxy
obs
n2
2
1 rxy
Construccin de los Intervalos de Confianza:

rlmite inf erior
rlmite sup erior
NOTA: En estas ecuaciones rxy es el coeficiente de
correlacin de la muestra y F es el valor crtico en funcin de
los grados de libertad (n-2) y un error permitido mediante .
(Blair y Taylor, 2008).
- ERROR DE ESTIMACIN DEL CRITERIO: Para ello se

utiliza la siguiente frmula:
y x S y 1
2
xy
Donde:
Sy = Es la desviacin tpica de las puntuaciones en

el criterio.
xy = Es el coeficiente de validez en el test.
1-. Calcule cul debera ser la longitud de la prueba

(nmero de tems que debera tener) para alcanzar
un nivel de fiabilidad de 0.70, 0.80 y 0.90.
Utilice la Frmula:
Rxx 1 rF
N
rF (1 rF )
donde:
Rxx= Es el coeficiente de Fiabilidad que se espera
alcanzar.
rF = Es el coeficiente de fiabilidad obtenido.
1 = Constante.
2-. Clculo de tems esperados (n):

donde:
n N n
n = nmero de tems que tenda el test

n = nmero de tems que tiene el test actualmente
N = Razn obtenida entre la fiabilidad esperada y la
fiabilidad obtenida.
ERROR MUESTRAL PARA MUESTRAS FINITAS (n<100,000)
EM
2
z p q
n
TAMAO MUESTRAL PARA POBLACIONES INFINITAS

(n>100,000)
2
z p q
2. FASES DEL DESARROLLO DE UNA PRUEBA
FASE 1: DEFINICIN DE LA PRUEBA
FASE 2: ELECCIN MTODO DE

ESCALAMIENTO DE LA PRUEBA
FASE 3: ELABORACIN DE
LOS REACTIVOS
FASE 4: ANLISIS DE
LOS REACTIVOS
FASE 5: REVISIN DEL

INSTRUMENTO
FASE 6: PUBLICACIN DEL

INSTRUMENTO
(Gregory, 2012 )
Esquema de la relacin entre los planos terico, emprico

y matemtico desde el punto de vista de la medicin.
Representacin formal de
PLANO TERICO
Modelo terico que incluye los
conceptos (constructos) que
definen a las VARIABLES
LATENTES.
los modelos
Representacin emprica
PLANO MATEMTICO
Representacin formalizada del
modelo y representacin
numrica de los indicadores
empricos
Representacin numrica de los
de los constructos
indicadores
PLANO EMPRICO
Indicadores empricos de las
variables latentes
(Favorece la
Operacionalizacin)
RESPONDER A LAS SIGUIENTES PREGUNTAS

PREGUNTAS
RESPUESTAS
Cul va a ser el contenido del test ?
CONTENIDO
Qu tipo de tems se van a utilizar ?
FORMATO
Cuntos tems debe tener la prueba ?
LONGITUD
Qu propiedades mtricas debe tener ?
INDICADORES PSICOMTRICOS
ESPECIFICACIN DE LAS ETAPAS:

1. Definicin de la Prueba:
-Definir Teora de Base del constructo,
- Seleccin del Constructo,
- Objetivos de la Escala,
- Revisin de la literatura
- Deteccin de indicadores y dimensiones emergentes

(Tcnica Grupos Focales) .
Diseo de Investigacin: EXPLORATORIO SECUENCIAL (Fase

Derivativa. Ver en Hernndez Sampieri, 2010)
FORMATO GENERAL
FASE CUALITATIVA
FASE CUANTITATIVA
1. Recoleccin Datos Cualitativos

(Grupos Focales)
1. Recoleccin Datos Cuantitativos

1.1 Estudio Piloto (Versin
Preliminar).
2. Anlisis Cualitativo (Indicadores,

Dimensiones Emergentes del
Constructo)
2. Anlisis Propiedades Mtricas

2.1 tems
2.2 Prueba
3. Ensamblaje Definitivo
3.1 Versin Final.
2. Eleccin mtodo de escalamiento de la prueba:

- Establecimiento de reglas de medicin : asignacin
de nmeros a las respuestas).
2.1
Mtodo
de
escalamiento
representativo
(ordenamiento de expertos validez de contenido) :
Clasificacin ordinal de los jueces expertos para
analizar la validez de contenido de los tems;
Los jueces expertos calificarn los tems con la siguiente escala:
REVISOR: ______________________________________
FECHA: _________
Por favor, lea con cuidado la especificacin de dominio para esta

prueba. A continuacin indique qu tan bien considera que el
reactivo refleja la especificacin del dominio. Juzgue el reactivo
nicamente con base en la correspondencia entre su contenido y el
contenido definido por la especificacin del dominio.
AFIRMACIN: Acostumbro a sonrojarme cuando tengo que hablar con
personas desconocidas.
Utilice la Escala de calificacin de cuatro puntos que se muestra a continuacin.
1.
IRRELEVANTE
_____________
2. BAJA RELEVANCIA
3. MODERADA RELEVANCIA
4. ALTA RELEVANCIA
_____________
_____________
_____________
Seale la Dimensin a la cul pertenecera la presente afirmacin.
COGNITIVO
_____________
EMOCIONAL
_____________
CONDUCTUAL
_____________
OTRA
_____________
Propuesta de Redaccin del tem (si lo estima del caso):
Adaptado de (Gregory, 2012)
Interpretacin valores obtenidos conforme a los rangos

sealados:
VALOR OBTENIDO
0.75 o MS
ACUERDO
Excelente
INTERPRETACIN
Alta Relevancia
0.60-0.74
Excelente
Alta Relevancia
0.40-0.59
Bueno
Moderada
Relevancia
0.39 o MENOS
Pobre
Baja Relevancia
DECISIN
Incorporarlo en
la Prueba (I)
Incorporarlo en
la Prueba (I)
Incorporarlo en
la Prueba previa
si el segundo
acuerdo de los
jueces es igual o
mayor que 0.60
(R)
Eliminarlo de la
Prueba (E)
Adaptado de (Pardo y Ruiz, 2002)
2.2 Mtodo de Escalamiento Absoluto 1: Clasificacin

ordinal de los datos registrados (formato de
autoinforme) a partir de las respuestas de los
participantes
del
estudio
para
analizar
la
discriminacin, fiabilidad y validez de los tems.
Ejemplo: ESCALA DE RESPUESTA de 5 categoras

1
Totalmente en
desacuerdo
En
desacuerdo
Ni de acuerdo
ni en
desacuerdo
De acuerdo
Totalmente de
acuerdo
- Segn De la Garza, Morales y Gonzlez (2013)
CRITERIOS CLASIFICACIN NDICES DE DISCRIMINACIN (Ebel, 1965;

Garca-Cueto y Fidalgo, 2005), FIABILIDAD Y VALIDEZ TEMS (Thorndike,
1989; Magnusson, 1983) :
NDICE DISCRIMINACIN
NDICE FIABILIDAD Y VALIDEZ
VALOR
INTERPRETACIN
VALOR
0.40 o ms
El tem discrimina
muy bien
0.81-1.00 o Ms
INTERPRETACIN
Muy Alta
(ACEPTABLE)
(ACEPTABLE)
0.30 - 0.39
Alta
0.61-0.80
(ACEPTABLE)
(ACEPTABLE)
0.20 - 0.29
Moderada
0.41-0.60
Baja
0.21-0.40
Muy Baja
Baja
(ELIMINAR)
(ELIMINAR)
0.10 o Menos
Moderada
(ACEPTABLE CON REVISIN
NUEVA)
(ACEPTABLE CON REVISIN

NUEVA)
0.10 - 0.19
Alta
Menos de Cero -0.20
Muy Baja
2.3
Mtodo
de
Escalamiento
Absoluto
2:
Escalamiento complejo de las puntuaciones por
dimensiones y puntajes totales de los instrumentos
(independencia, normalidad y homocedasticidad).
3. Fase de Elaboracin de los reactivos (tems): A

partir de los mtodos de escalamiento indicados, se
utilizar una Escala de Respuestas ordenadas sobre
un continuo de respuestas con un continuo de
acuerdo
o
desacuerdo
y
de
aprobacin
desaprobacin.
- En tal sentido, los procedimientos para
construccin de los tems de las escalas sern:
3.1 Mtodo Racional.
3.2 Mtodo de Clave Emprica.
la
3.1 Mtodo Racional (consistencia interna):

- Asume los puntajes de los reactivos de la escala
tendrn valores positivos en los coeficientes de
correlacin entre los tems y con los puntajes totales
de las dimensiones y de la escala
3.2 Mtodo de Clave Emprica:

- Algunos de los tems no exhibiran una relacin clara
con las evidencias obtenidas en las investigaciones
cientficas revisadas (deteccin de indicadores y
dimensiones emergentes del constructo en la fase
cualitativa
va
focus
groups)
y,
porque
eventualmente permitira distinguir diferentes grupos
de sujetos.
- Se tratar de responder la las preguntas sobre la
homogeneidad de los reactivos (tems), el rango de
dificultad, fiabilidad y validez que tienen y,
finalmente, cuntos reactivos se construirn y tendr
los instrumentos en su versin inicial
4. Fase de Anlisis de los Reactivos:

4.1 Fase Cualitativa: se realiza una codificacin axial
de las evidencias procedentes tanto de la revisin
bibliogrfica como de los datos obtenidos mediante
focus group.
- Posteriormente se realizar el proceso de
codificacin abierta y la obtencin de categoras
emergentes.
4.2 Fase Cuantitativa:

- Se realiza anlisis de la frecuencia, obtencin de
medidas de tendencia central (mediana, moda y
media), medidas de variabilidad (desviacin
estndar, varianza y cuas varianza).
- Se aplica el instrumento provisorio a la muestra
seleccionada
previamente
(muestreo
no
probabilstico) .
- Se evalan las propiedades mtricas provisorias de
las puntuaciones de los tems, dimensiones y de la
escala total. Las propiedades mtricas provisorias a
evaluar sern confiabilidad, validez, discriminacin,
homogeneidad y comparabilidad.
Diseo de Investigacin: EXPLORATORIO SECUENCIAL (Fase

Derivativa. Ver en Hernndez Sampieri, 2010)
FORMATO GENERAL
FASE CUALITATIVA
FASE CUANTITATIVA

(Grupos Focales)

Preliminar).

Constructo)

2.1 tems
2.2 Prueba
3.1 Versin Final.
- Para los escalamientos 1 y 2 se utilizan:

4.2.1 Procedimientos estadsticos de distribucin
libre (prueba de acuerdo interjueces a partir de los
trabajos de Martuza (1977), Hambleton (1984), Bausel
(1986) (en Gregory, 2012) y la correlacin de rangos
ordenados, la prueba de U de Mann Whitney).
4.2.2 Se evaluarn los ndices de validez de
contenido de las puntuaciones de los tems, ndices
de discriminacin, fiabilidad (consistencia interna) y
validez (criterio).
- Para el Escalamiento 2 se utiliza:

4.2.3 Se utilizan los procedimientos estadsticos
paramtricos para:
1-. Evaluar supuestos (Prueba de Normalidad de
Kolmogorov-Smirnov o Shapiro Wilks en funcin de los
tamaos muestrales, Prueba de Rachas para evaluar
independencia de las puntuaciones),
2-. Anlisis de la Varianza para evaluar la
homocedasticidad, prueba de correlacin productomomento de Pearson para evaluar fiabilidad y validez
provisorias de las puntuaciones, anlisis de la
regresin lineal, mltiple y multinomial, Prueba de
diferencias de medias t y ANOVA).
4.2.4 Anlisis de la Fiabilidad Provisoria de las

puntuaciones de los instrumentos, se utiliza ndice de
fiabilidad Alfa de Cronbach y el error tpico de
medida.
4.2.5 Anlisis de la validez provisoria de las
puntuaciones mediante Anlisis Factorial. La validez
de criterio externo (convergente y/o divergente)
provisoria se obtendr mediante mediante el ndice
de correlacin de Pearson.
4.2.6 Normas Provisorias de las puntuaciones de la
prueba se evalan mediante puntuaciones derivadas
(rangos percentiles) y estndar (puntuaciones z,
puntaje T, estaninas y el puntaje de aproximacin a la
distribucin normal).
5. Fase de Revisin del Instrumento:

5.1 Una vez eliminados los tems que tengan baja
discriminacin fiabilidad y validez de la etapa
anterior, con una muestra de similares caractersticas
que las etapas anteriores a fin de recabar
informacin adicional sobre el anlisis de los reactivos
para realizar los ajustes mtricos que se estimen
necesarios (menores o mayores).
5.2 En funcin de los ajustes que se identifiquen, se
realizara adicionalmente un procedimiento de
validacin cruzada para confirmar nuevamente la
validez de las puntuaciones de la prueba dado que
la validez de criterio original (obtenida en la etapa
anterior) es preliminar y tentativa (provisoria). .
5.3 El fundamento tcnico de esta etapa es utilizar la

ecuacin de regresin original en esta nueva muestra
para analizar si es que las puntuaciones del
instrumento construido predicen las del criterio.
NOTA: Dado que las evidencias muestran que la
validacin cruzada predice el criterio con menor
precisin, se puede hacer una prueba de reduccin
de la validez a fin de evaluar mediante los ndices de
correlacin entre las puntuaciones totales de los
instrumentos y del criterio si es que la cantidad de
tems de la escala ser ajustado en trminos leves,
moderados o fuertes.
6. Publicacin de los Instrumentos: En el caso que los

instrumentos tengan un respaldo emprico y
estadstico significativo, se procede a la produccin
del material de evaluacin, la redaccin de un
manual tcnico (anlisis mtrico de los instrumentos) y
un manual del usuario (aplicacin e interpretacin de
las puntuaciones).
Estos manuales se hacen siguiendo los Estndares
para la Evaluacin Educativa y Psicolgica (APA,
AERA Y NCME. Gregory, 2012).
De igual modo, se procede a la obtencin de las

respectivas patentes intelectuales.
2. CONFECCIN DE LOS TEMS (Prat y Soval, 2003):

ESTRATEGIAS PARA LA GENERACIN DE TEMS.
2.1 Diseo de la Escala debe estar fundamentado en
que los tems cumplan las siguientes condiciones.
1. Estar relacionada con la CONDUCTA que se
pretende registrar y medir.
2. Representar todos los conceptos incluidos en
la definicin de la CONDUCTA.
3. Ser adecuados para la poblacin diana.
2.2 Una ESCALA puede CONSTRUIRSE a partir de:

1. tems originales o adaptados provenientes de
otras escalas diseadas con anterioridad.
2. tems construidos a partir de la opinin de
personas expertas sobre el comportamiento
(OBJETO) que se pretende registrar y medir.
3. tems generados a partir de ideas y opiniones
manifestadas por personas provenientes de la
poblacin diana.
4. tems generados a partir de ideas recogidas

de diversas fuentes de informacin relacionados
con la CONDUCTA:
- Libros
- Peridicos.
- Artculos cientficos o Papers.
- Eslganes
4. Evitar expresiones coloquiales y del argot

dado que slo seran comprensibles por ese
grupo y en un determinado tiempo.
5. Variar la direccin de la pregunta: Colocar

igual nmero de tems enunciados positiva y
negativamente.
2.3 Estrategias a seguir (Crocker y Algina, 1986):

1. ANLISIS DEL CONTENIDO: Definicin del constructo
(PARTE DEL REPERTORIO DE CONDUCTAS NO
OBSERVADO) requiere entre otras cosas realizar:
1. Preguntas abiertas a los sujetos a estudiar.

2. Agrupar respuestas por temas.
3. Temas recurrentes implican dimensiones
principales.
2. REVISIN BIBLIOGRFICA: Estudios previos que

definen el listado de conductas a observar.
3. INCIDENTES CRTICOS: Definicin de los extremos
del continuo.
CONDUCTA EMITIDA
Verbaliza Saludo con personas
desconocidas
CONDUCTA NO EMITIDA
No verbaliza Saludo con
personas desconocidas
Establece contacto visual directo Elude contacto visual directo con

con otra persona
otra persona
Finaliza una conversacin
Evita la conversacin
4. OBSERVACIN NATURAL: Identificar las conductas

mediante observacin directa.
Ejemplo: Registrar en Sala de Clases la cantidad de
golpes en cualquier parte del cuerpo que un nio le
da a otros. (Conducta de Agresin Fsica).
5. OPININ DE EXPERTOS: Sistemas expertos que

definen con mayor precisin el constructo.
6. OBJETIVOS DE LA INSTRUCCIN: Especificacin

de los objetivos que se busca medir.
7. MUESTREO DEL DOMINIO DEL TEM: Definir la
poblacin de tems de la cual se extraer una
muestra para formar el test.
8.
TABLA DE ESPECIFICACIN DE LOS TEMS:
construir variables latentes (CONDUCTAS NO
OBSERVADAS) en el mbito cognitivo y siguiendo la
taxonoma de Bloom.
NORMA ISO 10667 PARA INSTRUMENTOS

PSICOLOGA (Muiz y Fernndez-Hermida, 2010).
EN
- ISO: Sigla en ingls y que significa Organizacin

Internacional para la Estandarizacin (www.iso.org).
- Desarrolla normativas en todos sectores industriales
y de servicios.
INSTITUCIONES
CONSTRUCCIN:
PARTICIPANTES
EN
SU
1. Colegio Oficial de Psiclogos de Espaa (COP).

2. Asociacin Americana de Psicologa (APA).
3. Asociacin Britnica de Psicologa (BPS).
- Ser aplicable a:
1. Los procedimientos y mtodos utilizados a:

1.1 Nivel Individual:
Formacin.
Seleccin,
Consejo
1.2 Nivel Grupal: Clima y cohesin de equipos de

trabajo.
1.3 Nivel Organizacional: Clima laboral, cultura de
empresa, satisfaccin.
- Aspectos de la Norma: Se describen
1.Las competencias, obligaciones y responsabilidades

de los clientes y de los proveedores del servicio de
evaluacin, antes, durante y despus del proceso
evaluativo.
2. Proporciona directrices para todas las partes
implicadas en el proceso evaluador, incluida la propia
persona evaluada y quienes reciban los resultados de
la evaluacin.
3. Tiene como objetivo la REGULACIN DEL PROCESO

DE EVALUACIN DE LAS PERSONAS EN CONTEXTOS
LABORALES Y ORGANIZACIONALES.
- PROCESO DE EVALUACIN:
1. Establecimiento del Contrato de Evaluacin.

2. Metodologa de la Evaluacin .
3. Obtencin de los Resultados.
4. Anlisis de los Resultados.
5. Utilizacin de los resultados.
- INTERS PARA LOS PSICLOGOS: Esta nueva norma

lo es por algunas de las siguientes razones::
1. Papel Central en la evaluacin de personas en
contextos laborales.
2. Al ser vez aprobada las EMPRESAS E INSTITUCIONES

PODRN
CERTIFICARSE
garantizando
que
cumplen con la norma.
3. An no tiene rango legal (en sentido estricto),
pero,
constituye
una
importante
NORMA
REGULADORA DEL
MERCADO (Estar certificado no
es lo mismo que no estarlo).
2.4 ESCALAS DE VALORACIN:

- Escalas de categoras: Son tems que estn
A-. Formados por un enunciado.
B-. Formado por un conjunto de alternativas
organizadas (Secuencia u orden).
C-. Las categoras usadas expresan
muchos caractersticas de las conductas
2.4.1 Diseo de Investigacin: EXPLORATORIO

SECUENCIAL (Fase Derivativa. Ver en Hernndez
Sampieri, 2010)
FORMATO GENERAL
FASE CUALITATIVA
FASE CUANTITATIVA

(Grupos Focales)

Preliminar).

Constructo)

2.1 tems
2.2 Prueba
3.1 Versin Final.
2.4.2 TIPOS DE ESCALAS (Levy y Varela, 2003)

LIKERT
Objetivo
THURSTONE
GUTTMAN
Escalar Personas
Escalar personas
Escalar Personas e tems
Supuesto sobre los tems
Hiptesis:
1. tems son homogneos
2. tems son formalmente
distintos
3. tems miden lo mismo
Hiptesis:
1. tems son diferentes
entre s
2. tems representan
niveles distintos del
atributo
Hiptesis:
1. tems son heterogneos.
2. tems representan niveles
distintos del atributo.
Papel de las Personas
Objeto Estudio: Diferencias

Personales
1.
Objeto Estudio: Diferencias

Personales
2.
Justificacin de los valores de

la Escala
Comprobar:
1. Respuestas son
coherentes (Medidas de la
conducta)
2. Si punto 1 se cumple,
entonces, tems se pueden
agregar para Escalar
Personas
Fase Escalamiento
tems: Personas
(jueces) constituyen
instrumento de medida.
Fase Dos: Estudio
diferencias
Individuales.
1. Fase 1: Comprobar
objetividad (acuerdo
entre ellos) respuestas
jueces (Permite escalar
estmulos).
2. Fase 2: Estmulos
Escalados permiten
Escalar Personas.
1. Escalamiento de Personas:
e tems: Coherencia de
Respuestas.
2. Cada respuesta en funcin
del nivel de la persona y del
que representa el tem.
2.4.3 ESCALA LIKERT: Permiten registrar
1-. EL GRADO DE ACUERDO O DESACUERDO CON EL

ENUNCIADO.
2-. Al Evaluado se le solicita POSICIONARSE
ACTITUDINALMENTE respecto de una idea, hecho u
objeto.
3. Se usan de forma intensa en Psicologa.
4. Son fciles de elaborar.
5. Se utilizan para medir actitudes.

6. Son confiables.
7. Funcionan mejor utilizando como ESCALA DE
RESPUESTAS 5 categoras
1 : APROBACIN DEL REACTIVO EN UN EXTREMO
5: APROBACIN DEL REACTIVO EN EL OTRO

EXTREMO
Ejemplo: ESCALA DE RESPUESTA de 5 categoras

1
Totalmente en
desacuerdo
En
desacuerdo
Ni de acuerdo
ni en
desacuerdo
De acuerdo
Totalmente de
acuerdo
- Segn De la Garza, Morales y Gonzlez (2013)
- En funcin de lo sealado por De la Garza, Morales y

Gonzlez (2013) los componentes de una Escala
Likert se operacionalizaran como:
COMPONENTES DE LA ESCALA
COGNITIVO
AFECTIVO
CONDUCTUAL
1. Resume informacin de la
persona sobre objeto
actitudinal
(comportamiento u
objeto de inters).
1. Sentimientos que una

persona tiene en relacin
a una conducta u objeto
de inters.
1. Representa las
EXPECTATIVAS (sealar
verbalmente por
adelantado cmo actuara
en el caso que algo
suceda) que una persona
tiene en relacin con su
comportamiento.
2. Creencias que tiene sobre

las caractersticas del
comportamiento u objeto
de inters
2. Preferencias que una

persona tiene en relacin
a una conducta de inters
2. Refiere a la INTENCIN
de accin (hace algo en
funcin de una
consecuencia anterior)
respecto al objeto de
inters
8. Se basa en los siguientes supuestos:
1. CONSIDERA LAS ACTITUDES COMO UN CONTNUO:

La probabilidad de respuesta de una persona es una
Funcin Montona con la posicin que la persona
ocupe en el Continuo Hipottico de Respuesta.
Probabilidad
Respuesta
Pa
Pb
Pc
Favorable
Actitud
2. Es posible estudiar las dimensiones de las

actitudes a partir de un conjunto de enunciados
que responden los sujetos.
3. Los individuos pueden situarse respecto de la

variable desde un punto de vista ms favorable o
desfavorable.
2.4.4 La VALORACIN de los sujetos en la variable:
3.1 NO supone una DISTRIBUCIN UNIFORME

SOBRE UN CONTINUO DE ACTITUD,
3.2
Supone
su
posicin
FAVORABLE
DESFAVORABLE SOBRE EL OBJETO ESTUDIADO.
2.4.5 PASOS PARA CONSTRUIR UNA ESCALA TIPO LIKERT:

1. Redacte el mismo nmero de oraciones favorables
y desfavorables respecto de los indicadores de las
conductas a observar.
2. Solicite a los evaluados que se POSICIONEN
ACTITUDINALMENTE para cada tem utilizando LA
ESCALA DE RESPUESTA
1
Totalmente en
desacuerdo
En desacuerdo
Ni en Desacuerdo
ni de Acuerdo
De Acuerdo
Totalmente de
Acuerdo
3. Recuerde que:
3.1 Los valores de esta escala como puntuacin sea

calificada entre dos extremos:
- Totalmente en Desacuerdo (1)
ITEM DESFAVORABLE
- Totalmente de Acuerdo (5)

ITEM FAVORABLE
4. Utilice una ESCALA SUMATIVA a partir de las

puntuaciones registradas para cada respuesta
con el fin de determinar los reactivos ms
discriminativos .
IMPLICANCIA
- Los tems registrarn con mayor probabilidad (de
manera global) puntajes ALTOS en aquellos
sujetos que tienen puntajes ms altos en la
variable y viceversa.
5. Rechace los reactivos con bajo poder

discriminativo manteniendo un equilibrio con los
reactivos favorables y desfavorables.
(Coolican, 1997)
2.6 NORMAS DE REDACCIN DE ENUNCIADOS:
1. Lenguaje utilizado (vocabulario y estructura de

frases) debe ser sencillo (simple, claro y directo)
y gramaticalmente correcto (respetar las reglas
oficiales del idioma espaol)
2. Los enunciados deben ser cortos (no ms de 20
palabras), redactados en tiempo presente (evitar
redactar en pasado y que se refieran a un solo
grupo) .
3. Deben contener una sola idea y relacionada con
el objeto actitudinal (El objeto de la actitud debe ser
el sujeto de la oracin del reactivo).
4. Deben ser especficos (evitar ambigedad y doble

significado), es decir, con una sola interpretacin
posible (interpretacin unvoca).
5. Expresar actitudes, preferencias, sentimientos o
creencias (en el presente), pero NO HECHOS sobre
los cuales tendran la misma respuesta.
6. Redactarse de manera favorable y desfavorable en
similar proporcin.
7. Deben evitarse palabras con significado genrico

(Universalidad) como:
Siempre, Nunca, Nadie, Ninguno, Todos
8. Deben evitarse palabras que tienen significado
indefinido como:
A veces
Apenas
9. Redacte 20 por cada actitud o dimensin.
10. No formule afirmaciones demasiado extremas.
11. Permita que quienes respondan indiquen su nivel

de acuerdo a la respuesta elegida.
12. Verificar que se califique la Escala de Respuesta
como:
Lado negativo:
Lado Positivo:
13. Seleccionar tems que puedan cubrir toda la

escala de Respuesta.
14. Las personas deben responder diferencialmente

(funcin monotnica el nivel actitudinal) , por lo que
se deben evitar los enunciados con los cuales todos
pueden estar de acuerdo.
15. Emplear moderadamente palabras como
Solamente,
nicamente
La mayor parte del tiempo.
16. Evitar doble negacin.
(Thurstone y Chave, 1929; Likert, 1932; Bird, 1940; Thorndike y Hagen, 1989, 2001;
Aiken, 2003, Cortada de Kohan, 1999, 2000, 2004; Prat y Doval, 2003; Cohen y
Swerdlik, 2006).
Ejemplo TEM 1: La caza de animales es buena.

1
Totalmente en
desacuerdo
En
desacuerdo
Ni de
acuerdo ni
en
desacuerdo
De acuerdo
Totalmente de
acuerdo
- CONDUCTA O VARIABLE DE INTERS?

- TEM FAVORABLE O DESFAVORABLE?
- EXISTE ESCALA DE RESPUESTA ?
Ejemplo TEM 2: Hara trampa en el pago de los

impuestos si tuviera la oportunidad.
1
Totalmente en
desacuerdo
En
desacuerdo
Ni de
acuerdo ni
en
desacuerdo
De acuerdo
Totalmente de
acuerdo

Ejemplo TEM 3: Las mujeres tiene una necesidad

instintiva de estar cerca de su hijo durante los
primeros dos o tres aos de su vida.
Totalmente
en
desacuerdo
En
desacuerdo
Ni de
acuerdo ni
en
desacuerdo
De acuerdo
Totalmente de
acuerdo

- Ejemplo:
AFIRMACIN: Acostumbro a sentir inters de ayudar

a otro cuando alguien me cuenta de sus problemas
REDACCIN
Favorable
Desfavorable
DIMENSIN
Cognitivo
Afectivo
Conductual
- Ejemplo: CONDUCTA EMPTICA

REDACCIN
Favorable
Desfavorable
DIMENSIN
Cognitivo
Afectivo
Conductual
- Ejemplo: CONDUCTA EMPTICA

REDACCIN
Favorable
Desfavorable
DIMENSIN
Cognitivo
Afectivo
Conductual
VALIDEZ DE CONTENIDO TEMS:
Ejemplo 1.1: Calcule el ndice de Validez de Contenido

de los 10 tems de la Escala de Honestidad evaluada
por 20 jueces expertos.
1.1 Calcule el ndice de Validez de Contenido con la
frmula
D
IVC
A B C D
(Marutza, 1977; Hambleton, 1984; Bausel; Gregory, 2012)
1.2 Seale el Tipo de Acuerdo, Relevancia y Decisin

respecto del ICV de cada tem.
Los 20 jueces expertos calificaran los tems con la siguiente escala:
REVISOR: ______________________________________
FECHA: _________
Por favor, lea con cuidado la especificacin de dominio para esta

prueba. A continuacin indique qu tan bien considera que el
reactivo refleja la especificacin del dominio. Juzgue el reactivo
nicamente con base en la correspondencia entre su contenido y el
contenido definido por la especificacin del dominio.
AFIRMACIN: Acostumbro a sonrojarme cuando tengo que hablar con
personas desconocidas.
Utilice la Escala de calificacin de cuatro puntos que se muestra a continuacin.
1.
IRRELEVANTE
_____________
2. BAJA RELEVANCIA
3. MODERADA RELEVANCIA
4. ALTA RELEVANCIA
_____________
_____________
_____________
Seale la Dimensin a la cul pertenecera la presente afirmacin.
COGNITIVO
_____________
EMOCIONAL
_____________
CONDUCTUAL
_____________
OTRA
_____________
Propuesta de Redaccin del tem (si lo estima del caso):
Adaptado de (Gregory, 2012)
- Una vez finalizada esta etapa se registraron los

siguientes resultados:
A
B
C
D
TEM 1
TEM 2
TEM 3
TEM 4
TEM 5
TEM 6
TEM 7
TEM 8
TEM 9
TEM 10
3
5
6
6
2
9
4
5
4
5
9
2
5
3
1
11
12
4
1
3
6
8
2
4
1
9
2
8
4
4
5
7
11
4
3
2
2
3
3
12
Interprete los valores obtenidos conforme a los rangos

sealados.
VALOR OBTENIDO
0.75 o MS
ACUERDO
Excelente
INTERPRETACIN
Alta Relevancia
0.60-0.74
Excelente
Alta Relevancia
0.40-0.59
Bueno
Moderada
Relevancia
0.39 o MENOS
Pobre
Baja Relevancia
DECISIN
Incorporarlo en
la Prueba (I)
Incorporarlo en
la Prueba (I)
Incorporarlo en
la Prueba previa
si el segundo
acuerdo de los
jueces es igual o
mayor que 0.60
(R)
Eliminarlo de la
Prueba (E)
Adaptado de (Pardo y Ruiz, 2002)
2.7 DEBILIDADES DE LA ESCALA LIKERT

1. Las puntuaciones en la escala slo tiene un
significado relativo (respecto a la Distribucin de los
datos de la conducta obtenida).
2. La puntuacin 3 (indeciso) es ambigua.

Implica una posicin neutral (ninguna opinin) o
una posicin indecisa en la que el respondiente se
encuentra dudando con sentimientos en ambas
direcciones?.
3. Las puntuaciones centrales de la distribucin

(entre percentil 30 a 60) son ambiguas.
NOTA 1: Podran reflejar muchas respuestas
indecisas o que podran comprender una
coleccin de respuestas totalmente a favor o
totalmente en contra.
NOTA 2: En esta situacin se podran estar
midiendo dos variables distintas.
4. Personas con una misma puntuacin pueden

tener pautas de respuesta diferentes.
5. No es posible tratar la calificacin como si
tuviera un significado nico.
2.8 IMPORTANTE
1. La Escala Likert es un tipo de escala de estimacin
y sus respuestas se registran en una Escala Ordinal.
2. Para tratar sus datos son como si estuvieran
medidos en una escala de intervalos se requiere
hacer un Contraste de Hiptesis acerca de la
Normalidad de las Puntuaciones.
(Cortada de Kohan 2000, 2004; Hernndez-Sampieri,
Fernndez-Collado y Baptista, 2006; 2010;
Tornimbeni, Prez y Olaz, 2008).
3. La puntuacin final de la prueba se obtiene

sumando las estimaciones de todos los reactivos
(ESCALA SUMATIVA).
4-. La puntuacin obtenida por los sujetos en la
escala est en funcin de los puntajes obtenidos
en cada tem.
2.9 Aspectos SE DEBEN EVITAR en la construccin de

los reactivos:
1 Ejemplo:
Deberamos empezar a tomar acciones compensatorias en
reas en donde, en el pasado, los miembros de un grupo
tnico, sexo o tipo de invalidez han sufrido discriminacin o han
experimentado desventajas como resultado directo de ser un
miembro de esa categora.
Analizar:
Es un tem favorable o desfavorable?
Qu errores detecta en la construccin?
Qu modificaciones le hara a la construccin?
Errores:
1.Complejidad: La oracin impide que se
comprenda que es lo que se est diciendo o
preguntando.
2. Ambigedad: La oracin se puede interpretar de
distintas maneras
3. Uso del trmino DEBERA.
SOLUCIN: Descomponer la frase lgicamente y

redactarla de manera simple, directa y usando
menos de 20 palabras.
Ejemplo:
Los miembros de distintos grupos tnicos dentro de un pas tendran
que acceder a los mismos derechos que los que los ciudadanos del
pas que habitan si es cuentan con permiso de residencia.
2. Ejemplo:
La sociedad debera comenzar a deshacerse del

racismo institucional siempre que sea posible.
Analizar:

Qu modificaciones le hara a la construccin
Errores:
1. Trminos tcnicos: Muchos respondientes no

tendrn claro a que se est haciendo referencia.
SOLUCIN: Se tendr que encontrar otro trmino o
incluir un prembulo especial que lo explique.
Ejemplo:
Las reglas de la sociedad tendran que ser claras prohibiendo un trato

discriminatorio a las personas de raza diferente.
3. Ejemplo:
No debera permitirse a los inmigrantes

establecerse en reas de gran desempleo.
Analizar:

Qu modificaciones le hara a la
construccin
Errores:
1. Ambigedad: Impide discriminar entre los que
manejan un contenido o conocimiento.
2. Introduccin de negacin.
SOLUCIN: Utilizar una frase con un solo sentido,
positiva y con lgica.
Ejemplos:
Los inmigrantes deberan tener posibilidades de empleo de acuerdo a
las competencias que tienen.
Los inmigrantes deberan tener posibilidades de empleo de acuerdo a
las necesidades del mercado.
4. Ejemplo:
El aborto es de manera exclusiva una opcin de la
mujer y debera de estar a su disposicin
gratuitamente.
Analizar:

construccin
1. Reactivo de doble efecto: Se produce porque se

establecen dos preguntas o ideas en una misma
frase.
SOLUCIN: Utilizar una frase con una sola idea
redactada lgicamente.
Ejemplo:
El aborto es una decisin a la que puede optar la mujer.
El aborto debera de estar claramente legislado.
5. Ejemplo:
No debera ser posible preguntarle a una mujer
acerca del apoyo econmico que recibe de su
esposo, cuando a los maridos no se les hacen las
mismas preguntas.
Analizar:

Errores:
1. Negaciones: Puede resultar confuso responder una

pregunta con doble negacin porque cuesta
interpretar la respuesta.
SOLUCIN: Utilizar una frase con una sola idea y
redactada lgicamente.
Ejemplo:
Las mujeres merecen el mismo respeto que cualquier persona cuando
se les pregunta acerca del manejo de sus finanzas.
6. Ejemplo:
Las personas deberan pensar de unvocamente

en temas como el transporte, la educacin y la
salud.
Analizar:
construccin
Errores:
1. Lenguaje emotivo: Provoca activacin de procesos
cerebrales que interfieren en la capacidad de
respuesta del sujeto.
2. Trminos o palabras desconocidas:

UNIVOCAMENTE
SOLUCIN: Utilizar una frase redactada objetivamente
y en trminos neutros.
Ejemplo:
Es muy probable existan diferencias frente a los temas que

importan a la sociedad.
7. Ejemplo:
Est usted de acuerdo con que deberan
aumentarse los subsidios a las personas de la
tercera edad?.
Analizar:
Errores:
1. Preguntas sugestivas: Sitan la respuesta en un
contexto donde la respuesta ms probable es
afirmativa.
Tienen la desventaja que muchas
preguntas con poco contenido real.
veces
son
SOLUCIN: Utilizar una frase redactada con

contenidos reales y que sea equiprobable la opcin
de responder.
Ejemplo:
Es necesario que las polticas de apoyo a la tercera edad
sean claras a fin de evitar recargar el aumento de los
impuestos a los contribuyentes.
Es necesario que las polticas de apoyo a jubilados sean
claras a fin de evitar recargar el aumento de los impuestos a los
contribuyentes.
8. Ejemplo:
Tiene usted antecedentes penales?.
Analizar:

construccin
Errores:
1. Invasin de la intimidad: Son preguntas poco
pertinentes (vida privada o vida sexual), por lo
tanto la intromisin puede conducir a
incomodidad y a falsear la respuesta.
SOLUCIN: Evitar este tipo de preguntas.
ETAPAS CONSTRUCCIN TAIS
EJEMPLOS DE NUEVOS TEMS

INFORMATIZADOS (Muiz, 2011).
EN
CONTEXTOS
1. Highlighting Test, (Carey, 2001; Walker & Crandall, 1999)

Click on the sentence in the
paragraph to the left that best
describes the practical
meaning of the property of
invariance.
(Place the pointer on the
sentence you wish to
highlight, and click to select
it.)
\
Help
Previous
Next
Multiple Selection
Marco has $7.00 to spend on his lunch. Click on a drink, a
sandwich, and a side that Marco could have for lunch so that the
price of the three items adds up to $7.00 or less.
Drinks
Sandwiches
Sides
$1.25
Milk
$3.75
Veggie
$1.50
Chips
$.95
Tea
$4.50
Turkey
$1.00
Cookies
$1.50
Soda
$4.75
Roast Beef
$1.75
Rice
$1.25
Juice
$5.00
Pastrami
$1.50
Green Salad
$.95
Coffee
$4.75
Ham
$1.50
Fruit Salad
Inserting Text (Taylor et al., 1998)
Image courtesy of ETS/C. Mills (2000)
Highlighting Text
(Carey, 2001; Walker & Crandall, 1999)
Directions: Click on the one value in the number sentence below that must be
changed in order for the number sentence to be correct.
3+2+5 = 5+2+9 = 10
This is one way to allow students to
demonstrate understanding of the
commutative property of addition
Free-Response Mathematics
(Braswell & Kupin, 1993)
Note, a calculator can be accessed

by clicking on the icon.
Scores on two items for five examinees are given below. Complete the
table by computing the classical item difficulty for each of the items and
typing it into the highlighted boxes provided.
(You may use the calculator tool as needed.)

Examinees
Item 1
Item 2
Difficulty:
0.60
Difficulty:
0.80
CALC
BACK
NEXT
Graphical Modeling
(Bennett, Morley, & Quardt, 2000)
Directions: Use the information in the table below to finish the bar
chart. Drag the bar labeled Other Color to show the percent of
people in that category.
Eye
Color
Percent
Brown
Eyes
50%
Brown Eyes
Blue Eyes
Blue
Eyes
30%
Other
Color
20%
Other Color
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Computer-based essay
In the space provided,
please write an essay addressing the topic given below.
The earliest known evidence of testing dates back to

Chinese employment testing thousands of years ago. Today,
we are talking about computer-based testing and the Internet.
Briefly (yet completely) describe three of the major
As educational and
psychological tests have
found new
useshave
in
developments
in measurement
practice
that
takenCut
place
aspects of everyday life, such tests have evolved in many interesting and
inexciting
history.
ways from their earliest beginnings. Three critical advances that
have particularly changed measurement practices include (1) the test
development efforts related to the Army Alpha tests during the World War
I era, (2) the theoretical innovations associated with the
conceptualization of item response theory, and (3), the introduction of the
computer as a mechanism for delivering tests and recording examinee
responses. In this essay, I will detail how such changes have impacted
Paste
Undo
Submit
Graphical Modeling
(Bennett, Morley, & Quardt, 2000)
Image from ETS/C. Mills (2000)
Site Planning Vignettes (Bejar, 1991)
This example comes from a licensing exam for architects. They are
required to use computerized tools to build buildings, parking lots, etc.
Image from NCARB (2000)
Dynamic Problem Solving

(Clauser et al., 1997)
This item, from a licensing exam for medical doctors, requires

the examinee to order medical tests and treat the patient in
real time.
Results of medical tests are
obtained by advancing the clock.
Image from NBME (2001)
Precaucin con los nuevos formatos de los

tems
1. Ser muy claro acerca de los constructos medidos
2. Evitar sesgos
3. Aportar datos sobre la fiabilidad y validez

4. Prestar atencin a los aspectos prcticos
5. Controlar posibles entrenamientos
7. MODELOS DE LOS TEST:

7.1 MODELOS MATEMTICOS: Se aplican cuando NO
EXISTE CONTROL RIGUROSO y REGISTRO PRECISO de
todas las conductas de inters.
Las variables independientes (PARTE DE LA

CONDUCTA
NO
OBSERVADA)
se
combinan
numricamente para predecir una variable
dependiente
(PARTES
DE
LA
CONDUCTA
OBSERVADA).
7.2
REGLAS
FORMALES
EXPLCITAS:
Integrar
informacin para una inferencia psicomtrica.
5. FUENTES DE ERROR EN EL PROCESO DE MEDICIN

5.1 VARIANZA DEL ERROR (Error).
DEFINICIN: Es el componente de puntuacin de
una prueba atribuible a fuentes distintas del
comportamiento medido (CONDUCTA REGISTRADA).
(Cohen y Swerdlik, 2006)
- Este planteamiento asume:

4.1.1 HAY FACTORES que
puntuaciones de la prueba.
influirn
en
las
4.1.2 Los FACTORES son AJENOS a lo que la

prueba pretende medir
- Existen muchas fuentes potenciales de varianza

de error, a saber:
1. El evaluado se encuentra enfermo
momento de responder una prueba.
al
Evaluado como fuente de error
2. El nivel de profesionalismo de los evaluadores

al conocer y aplicar la regla conforme a las
instrucciones de la misma.
Evaluador como fuente de error
3. Algunas pruebas son mejores que otras (calidad

tcnica) para medir lo que pretenden medir.
Ejemplo: El WAIS III es una prueba mejor que el
Rorschach para evaluar la inteligencia de los adultos.
Instrumento de medicin como fuente de error
Las puntuaciones de las pruebas siempre estn

sujetas a preguntas sobre el grado en que el proceso
de medicin incluye el error.
6. COLOCANDO A PRUEBA UN INSTRUMENTO:

Permite:
1. Responder preguntas.
2. Observar empricamente el impacto que sobre los
principios del modelo psicomtrico sobre:
- La construccin del Test.
- El uso posterior del Test
PREGUNTAS A QU RESPONDE:
1. Por qu usar este instrumento o mtodo en
particular ?.
2. Se ha publicado alguna gua sobre el uso de
esta prueba ?.
3. Es confiable este instrumento ? y Es vlido este
instrumento ?.
4. Sus medidas son comparables para diferentes

sujetos?. Se consideraron las variables
contextuales asociadas a la evaluacin y los
evaluados?.
5. Qu inferencias se pueden hacer de manera
razonable a partir de la calificacin de esta
prueba, y qu tan generalizables son los hallazgos
?.
7.3 BASADO EN PROBABILIDADES:

7.3.1 Establecer las relaciones entre las conductas no
observadas () y las conductas observadas (X).
7.3,2 Se DESCONOCE la manera en los sujetos que van
a responder a los tems.
7.3.2 Existir una distribucin de probabilidad de
valores con una valor dado de :
P (X )
NOTA: LA PARTE DE LA CONDUCTA NO OBSERVADA SE INFERIR A
PARTIR DE PARTE DE LA CONDUCTA OBSERVADA
7.4 Modelo de Medida:

7.4.1 No intenta explicar cada detalle de los
datos (tomados a partir de conductas
observadas)
7.4.2
Intenta
aproximar
patrones
de
comportamiento importantes o relevantes
(REPERTORIOS DE CONDUCTA EN TRMINOS
GENERALES).
7.5 Aspectos que deben ser considerados en el

Modelo:
7.5.1. Especificar la escala para las observaciones
(CONDUCTA REGISTRADA) en funcin de:
1. Una puntuacin.
2. La respuesta a un tem.
3. Una matriz de relaciones entre tems y
respuestas.
7.5.2. Especificar una o ms variables del diseo

(CONDUCTAS NO OBSERVABLES).
7.5.3 Especificar la combinacin entre las
variables independientes para predecir la
variable
dependiente
(CONDUCTAS
OBSERVABLES).
Aspectos que .. (continuacin):
7.5.4 LOS PESOS ESTADSTICOS de las variables del

diseo son los parmetros del modelo.
Especificar las relaciones entre PARTES DE LA
CONDUCTA OBSERVABLE Y NO OBSERVABLE
8. Modelos Bsicos en la Construccin de los Test:

8.1 Aplicacin en funcin de:
1. La Complejidad de los Problemas de Medida.
2. Evaluaciones a gran escala (EGE).
8.2 Teoras de los Test:

TCT
TG
TRI
Autores
Speraman
Cronbach
Lord y Novick
Estimacin
Caracterstica Inters
X= V+e
Funcin Matemtica
Lineal
P (u
1 )
i 1
Error tpico de Medida
ANOVA
Logstico y de Ojiva
Normal
Faceta
1 I
x 1 rxx
Fuentes de Error (Variancia

Verdadera, Dificultad del tem,
Interaccin, Aleatorio)
Supuestos
Normalidad
Homocedasticidad
Independencia
Normalidad
Homocedasticidad
Independencia
Unidimensionalidad
del test
Indeterminacin de la
Escala de Rasgo
Latente
Independencia Local
Parmetros
Discriminacin
Dificultad
Puntuacin del
Universo
Dificultad
Discriminacin
Pseudo adivinacin
ESQUEMA ELEMENTOS DE LA MEDICIN
OBJETO
PROPIEDAD
OBSERVABLE
Sistema Fsico sobre el que

se realizan una serie de
operaciones
Valor determinado por la

operacin
INSTRUMENTO
Permite llevar a cabo la
operacin
CUADRO n1: COMPARACIN TEORAS DE LA MEDICIN

CONCEPCIN
CARACTERSTICAS
Conservadora
(PRE-CLSICA,
CLSICA)
Axiomas de la Cantidad
Manipulacin Matemtica
es a Manipulacin Fsica.
Representacin emprica
mediante PROPIEDADES
REALES.
Directa / Fundamental
Propiedades Extensivas
Psicologa: UNIDAD DE MEDIDA

CONDUCTUAL (Psicologa
Neoconductista de Skinner)
- Psicologa: ESTRICTAMENTE
EMPRICA ( Psicologa
Neoconductista. de Skinner)
Psicologa: Sustituir la
RESTRICCIN DE LA ADITIVIDAD
EMPRICA (adherencia a reglas
aritmticas) por la ASIGNACIN
MEDIANTE REGLAS (niveles de
medida reemplazan a la
concatenacin)
- Escalas de Medida de Stevens

(PRINCIPIO DE LA
INVARIANZA)
Liberal
(REPRESENTACIONAL)
MEDICIN
(Aditividad Emprica)
Derivada / Indirecta
Propiedades Intensivas
(Sin Aditividad Emprica)
Por ndices: Definicin

arbitraria sobre la base de
observaciones empricas.
CUADRO N2
Aspecto
Teora Tradicional
Teora Representacional (Stevens)
Aspecto Previo y al margen de la

teora
Medicin sobre propiedades de
cosas
Nmeros corresponden a
magnitudes
Teora y Medicin conforman Binomio

Inseparable
Lo medido es un objeto en si mismo, no una
propiedad de ste
Los nmeros corresponden a objetos o
eventos
Magnitudes
Propiedades Objetos Materiales
Expresada en cantidades de las
propiedades de un sistema
No se miden atributos
Ampla concepto de medicin

Considera magnitudes y atributos
Magnitudes extensivas
e intensivas
Medida Fundamental slo es

posible en magnitudes extensivas
Leyes de cantidad son necesarias
Constatacin emprica de la
concatenacin
Magnitudes intensivas no se
pueden medir fundamentalmente
La distincin entre cantidades extensivas e

intensivas deja de ser un problema
Supera restricciones de la concatenacin
(requisitos de aditividad)
Propone medicin fundamental de
magnitudes intensivas (no necesita leyes de
aditividad para medir fundamentalmente)
Escalas de Medida
Ordenacin y cuantificacin de
sistemas materiales
Nivel mnimo de medidas
corresponde a ordenacin de
objetos
Escalas de Medida: SOLO EXISTIRA
DE RAZN
Ampla rango de medidas a

Transformaciones de Sustitucin Biunvocas
Escalas: Nominal, Ordinal, De Intervalos
Razn
Teora y Medicin
Naturaleza de lo
medido
CUADRO N3: AXIOMAS DE LA MEDICIN RESUMIDOS

POSTULADOS
PROPIEDADES DE RELACIN Y
DE LOS NMEROS
IDENTIDAD:
1. a = b o a b. (REFLEXIVIDAD)
2. a = b ,entonces, b = a (SIMTRICA)
3. a = b y b = c, entonces , c = a. (TRANSITIVIDAD
ORDEN JERRQUICO:
4. a > b , entonces , b > a (ASIMETRA)
5 . a > b y b > c, entonces, a > c (TRANSITIVIDAD)
IDENTIDAD LGICA
MAYOR O MENOR QUE

(N: ORDEN)
1-5: CONJUNTO ORDENADO
ADITIVIDAD:
6. Si a = p, b > 0, entonces , a + b > p (CONCATENACIN.
Posibilidad de Sumar)
7. a + b = b+ a
(CONMUTATIVIDAD)
8. a = p y b = q, entonces, a + b = p + q
(ESTABILIDAD DE LA RELACIN)
9. (a + b) + c = a + (b + c). (ASOCIATIVA)
ELEMENTO NEUTRO
(N: ORIGEN)
CONMUTATIVIDAD
(N: DISTANCIA)
ESTABILIDAD
(N: DISTANCIA)
ASOCIATIVIDAD
(N: DISTANCIA)
6-9: ADITIVIDAD O CONCATENACIN
FORMATO
- Elementos del PROTOCOLO:
1. Las instrucciones para la administracin.
2. Antecedentes de los evaluados.
3. La modalidad de Registro de las Respuestas.
4. El tiempo de duracin.
Asociado a lo anterior: CONDICIONES DE APLICACIN

Estandarizacin de Condiciones: Disposicin de medios
y fines en iguales para los diferentes grupos.
1. Entrega de instrucciones.
2. Espacio Fsico con variables de luz, temperatura.
3. Tiempo de Respuestas
4. Condiciones de los sujetos que responden:

Capacidad de lectura y comprensin lectora entre
otras.
LONGITUD:
1. Nmero de tems total de la Escala.
2. Nmero de tems por factor o dimensin.
3. Escala de Respuestas de los tems
(Registro).
4. Escala de Puntuacin individual y/o
Grupal.
NOTA: Evitar escalas con muchos tems para
evitar cansancio y fatiga, as como tambin,
errores en las respuestas.
- INDICADORES PSICOMTRICOS EN EL TEST:

1. Propiedades Psicomtricas de los tems.
- Fiabilidad.
- Validez.
- Discriminacin.
2. Propiedades Psicomtricas de la Prueba:
- Tipo de Fiabilidad
- Tipos de Validez

s1 Pi Usach 2014-A (Subrrayado)

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

s1 Pi Usach 2014-A (Subrrayado)

Uploaded by

Copyright:

Available Formats

SESIN N1: PSICOMETRA I

Introduccin: Definicin de Instrumentos o Pruebas

Lgica, Determinista, General, Parsimoniosa,

INTRODUCCIN: Meta de las Ciencias

IMPLICA: Recoger y comparar datos (MEDICIN).

- La rama que se dedica a LOS PROCESOS DE

2. Prctica : Construccin, evaluacin y

(Objeto con caractersticas

1.2.1 Prueba Psicolgica:

1.2.1.1 Caractersticas de las pruebas (Gregory, 2012):

3. Permite obtener puntuaciones o derivar

1.2.1.1 Caractersticas de las pruebas (Gregory, 2012):

- Depende principalmente de las instrucciones de

2. Muestra de Conducta: Es una muestra limitada de

Ejemplo: Se le aplica a un adulto la Escala de

Cuestin Esencial: Permite predecir conductas que

3. Permite obtener puntuaciones o derivar categoras:

- En trminos psicomtricos, las pruebas miden

- La IMPRECISIN de las pruebas es INEVITABLE.

- Un Psicmetra y, posteriormente un evaluador

- Evitar materializar las caractersticas medidas dado

4. Contemplan Normas o Estndares: La puntuacin de

5 Predicen conductas no evaluadas:

- La prueba no es un fin en si misma.

1. 2.2 Variables de los Instrumentos:

1.2.3 Contenido: Refiere a los temas de la prueba.

- Los reactivos de una prueba de personalidad a

4. Arreglo o disposicin de los reactivos.

3.1 Presente (Hetero aplicacin)

3.1 Desacuerdo hasta Acuerdo.

3.1 Consistencia de las Puntuaciones.

PERSPECTIVAS TERICAS (Navas, 2001)

ESTUDIO DE LA FIABILIDAD TCT (Doval, 2002)

Una nica aplicacin del

Con qu fidelidad corresponde este universo al

1.1 PROPIEDADES PSICOMTRICAS

Validez: Grado en el que el instrumento de

Ejemplo Coeficiente de Fiabilidad mediante Formas

FRMULAS COEFICIENTES DE FIABILIDAD

- CRITERIOS DE CLASIFICACIN COEF. CORRELACIN

Correlacin Muy Alta (Muy

- Integracin de Rangos Interpretacin Coeficientes de

0.80 < r < 0.90

0.70 < r < 0.80

(No hay relacin estadsticamente significativa entre las

Construccin de los Intervalos de Confianza:

1 Fcrtico rxy 1 Fcrtico

Para clculo de Sp utilice la frmula:

Para clculo de Sp utilice la frmula:

1-. Calcule cul debera ser la longitud de la prueba

2-. Clculo de tems esperados (n):

n = nmero de tems que tenda el test

ERROR MUESTRAL PARA MUESTRAS FINITAS (n<100,000)

TAMAO MUESTRAL PARA POBLACIONES INFINITAS

Ejemplo Coeficiente de Validez Convergente: Un

- Frmula Coeficiente de Validez Convergente:

- CRITERIOS DE CLASIFICACIN COEF. CORRELACIN

Correlacin Muy Alta (Muy

0.20 < r < 0.35

0.35 < r < 0.50

Validez Convergente: Correlaciones con escalas

0.55 < r < 0.65

0.65 < r < 0.75