Professional Documents
Culture Documents
1
Correspondencia: Facultad de Psicologa. Universidad de Granada. Campus Cartuja. 18071 Granada (Es-
paa). E-mail: hugocd@ugr.es.
522 CARRETERO-DIOS y PREZ. Desarrollo y revisin de estudios instrumentales
clinical and health psychology fields. The content is structured on seven principal
points, which are centred in each one of distinct phases of the test creation/adaptation
process. These are: study justification, conceptual and theoretical framework related to
construct to be assessed, items contruction and item theoretical assessment, item analysis,
internal structure study, reliability, and studies to obtain external evidences of validity.
An abstract of basic rules to be considered is presented. Finally it is noted the relevance
to not consider this rules only to create or adapt tests but to assess the adequacy about
using a particular assessment instrument.
KEY WORDS. Norms to review instrumental studies. Test construction. Tests adaptation.
Theoretical study.
Introduccin
Dentro de la gran variedad de trabajos de investigacin que surgen desde la Psi-
cologa, los centrados en la construccin o adaptacin de tests ocupan un lugar desta-
cado, lo que podra ponerse de manifiesto a travs de distintos ejemplos. As, la base
de datos PsycINFO, con las palabras clave test construction, test adaptation y test
translation dentro del campo de bsqueda materia (unidas con el nexo or), propor-
ciona para los ltimos cinco aos (2000-2004) un total de 2752 publicaciones. De igual
modo, en un estudio donde fue analizada la proporcin de trabajos publicados segn su
metodologa de estudio en las revistas de Psicologa en castellano con factor de impacto
durante los aos 2000-2001 (Buela-Casal, Carretero-Dios y De los Santos-Roig, 2002),
se constat como el 22% de los artculos publicados en la revista Psicothema, el 13%
de los aparecidos en la Revista Latinoamericana de Psicologa y el 25% de los presen-
tes en la Revista Mexicana de Psicologa tenan como objetivo analizar las propiedades
psicomtricas de algn instrumento de evaluacin. Si a esto se le aade que en la
mayora de trabajos de investigacin llevados a cabo en Psicologa se hace uso de tests,
En este estudio van a proponerse las normas a tener en cuenta para la elaboracin
y revisin de investigaciones instrumentales (vase el Anexo 1). Su finalidad es la de
servir como referencia para el interesado en la publicacin o revisin de trabajos de
estas caractersticas, a la vez que se llama la atencin al usuario de tests, es decir,
se insiste en que estas normas sean igualmente tenidas en cuenta a la hora de seleccio-
nar un instrumento de medida ya disponible para su aplicacin. La intencin no es que
los criterios que van a especificarse sean definitivos e indiscutibles. stos, a travs de
la comunicacin e intercambio entre profesionales, junto con el inevitable avance del
conocimiento, y considerando las observaciones, reflexiones y sugerencias que puedan
emitirse desde distintos puntos de vista, debern ir retocndose y adaptndose.
a cabo los resultados suelen alejarse de los encontrados con la escala original. As,
distintos autores han destacado como la traduccin suele ser una eleccin rpida y
arriesgada que conduce a resultados inadecuados (Osterlind, 1989; Smith et al., 2003),
y que finalmente provoca, en el mejor de los casos, un paso atrs en la investigacin
para una nueva formulacin de tems, y en el peor, un abandono del proceso y un dato
ms sin conexin ni utilidad. Por ello, hay que insistir en que la creacin y adaptacin
de tests es cuestin de reflexin y no de premura, y que se adopte la eleccin que se
adopte, deben seguirse las recomendaciones generales sobre este difcil proceso (AERA
et al., 1999). Dado que la traduccin es una prctica habitual entre los investigadores,
las normas que van a presentarse van a ocuparse de este proceso, aunque entendido
como uno de los posibles pasos a dar dentro de una adaptacin, y sin dejar de recomen-
dar al lector que acuda a trabajos especializados como los anteriormente citados.
estas relaciones las que acaban dando significado al valor que la escala facilite, siendo
esencial e ineludible su justificacin y especificacin.
definicin semntica qued bien recogida en los tems formulados. En este sentido,
dentro de la fase que nos ocupa, el propsito es proporcionar evidencias a favor de que
los tems construidos son relevantes para el constructo y representan adecuadamente a
cada uno de los componentes propuestos en la definicin semntica (Sireci, 1998). En
los estndares para la creacin de tests psicolgicos y educativos (AERA et al., 1999)
se subraya la necesidad de someter la batera de tems a una evaluacin por parte de
jueces seleccionados por tener unas caractersticas similares a la poblacin objetivo o
por ser expertos en la temtica. Lynn (1986) sugiere un mnimo de 3 jueces, aunque
esta cifra no est consensuada (Gable y Wolf, 1993) y va a depender de los intereses
del investigador y de la complejidad del constructo. A los jueces seleccionados se les
debe facilitar la definicin operativa del constructo a evaluar y la batera de tems
creada. Tienen que estimar si los tems son pertinentes para la faceta para la que han
sido creados, a la vez que indicar si el nmero de tems por componente refleja ade-
cuadamente la importancia atribuida en la definicin. Adems, se aconseja recoger
informacin sobre si los tems estn redactados de manera clara. Esta estimacin debe
hacerse a travs de una escala numrica de entre 5 y 7 puntos (Haynes et al., 1995) o
con cualquier otro procedimiento que permita cuantificar la valoracin de los jueces,
aunque luego los datos a tener en cuenta sean meramente descriptivos, usndose si
acaso el acuerdo inter-jueces para eliminar los tems ms problemticos. Si despus de
esta fase se opta por modificar algunos tems o escribir nuevos elementos, el proceso
de evaluacin debe repetirse. Finalizada la valoracin de los tems por parte de los
jueces, el autor/adaptador debe informar con claridad qu tems han sido eliminados y
por qu, a la vez que debe especificarse cul es finalmente la batera de tems conser-
vada.
La puntuacin individual que se obtenga para cada componente debe tener elementos
comunes con las otras facetas delimitadas, ya que han sido propuestas como integrantes
de un mismo constructo. Sin embargo, estos elementos comunes no deben superar un
lmite, ya que de lo contrario no podra sostenerse que son componentes distintos. En
esta direccin es donde resulta aconsejable hacer mencin a nuevos anlisis a incluir
en el estudio estadstico de los tems.
Junto al coeficiente de correlacin tem-total corregido deben efectuarse los an-
lisis de correlacin entre la puntuacin de los tems que configuran un componente y
la puntuacin total de los componentes que no sean el de pertenencia terica. Algunos
autores plantean que debe existir una diferencia positiva a favor del primer anlisis de
al menos dos dcimas (Jackson, 1970). Junto con el clculo anterior, es aconsejable
incluir la correlacin media inter-item. Este aspecto necesita de cierta reflexin. Cuan-
do est elaborndose un instrumento con la intencin de verificar una propuesta con-
ceptual sobre un constructo determinado, un criterio normalmente tenido en cuenta es
trabajar para que los componentes del constructo sean homogneos. Para lograr esta
homogeneidad, tradicionalmente ha sido usado el ndice de fiabilidad de consistencia
interna, intentndose que ste fuera lo mayor posible como indicativo de una faceta
homognea. As, cuando es calculado el ndice de discriminacin de los tems, se opta
por eliminar los que provocan que la consistencia interna del componente se incremente
(tal y como anteriormente ha sido explicado). Sin embargo, resulta necesario distinguir
consistencia interna de homogeneidad. Tal y como Cortina (1993) especifica, la consis-
tencia interna es el grado en el que los tems de un componente o faceta estn inter-
correlacionados, mientras que la homogeneidad se refiere a si los tems de ese compo-
nente evalan fundamentalmente slo a ste. Esto significa que la consistencia interna
es algo necesario pero no suficiente para conseguir una faceta homognea, o dicho de
otro modo, puede tenerse un grupo de tems altamente inter-correlacionados y que an
as no puedan ser considerados como representativos de un nico componente (Clark
y Watson, 2003). Debido a esto es recomendable llevar a cabo el clculo de la correla-
cin media entre los tems.
La forma de proceder a la hora de llevar a cabo la correlacin media inter-item,
consiste en calcular sta para los tems de cada uno de los componentes por separado,
para posteriormente calcularla teniendo en cuenta los posibles cruces entre componen-
tes. La lgica que debe subyacer para interpretar los datos es que la correlacin media
entre los tems de componentes distintos tiene que ser positiva para poder concluir que
forman parte de un mismo constructo, pero inferior a la aparecida para los tems de un
mismo componente (una diferencia de al menos dos dcimas segn Clark y Watson,
2003). Llegado a este momento es donde algunos autores recomiendan el uso del
anlisis factorial como procedimiento inicial incluido dentro del estudio de las propie-
dades de los tems (Floyd y Widaman, 1995). De hecho, las conclusiones que pueden
derivarse de los clculos de correlacin media inter-item son fcilmente obtenidas a
travs de la lectura del patrn de saturaciones factoriales. As, la tcnica de anlisis
factorial podra ser usada en esta fase, no todava como procedimiento de validez
interna, sino como herramienta para la seleccin de tems homogneos (vase el si-
guiente apartado para un comentario ms detallado sobre el anlisis factorial).
el otro a los negativos. As, el formato de los tems puede pesar ms que la significa-
cin conceptual y sin una exploracin detallada de los resultados lo emprico, pero
irrelevante, puede prevalecer sobre lo psicolgicamente sustantivo. As, cualquier cri-
terio usado debe estar caracterizado por la flexibilidad en su aplicacin. Los autores de
este artculo quieren mostrar su total rechazo hacia aquellos trabajos donde a partir de
un agrupamiento de tems inadecuadamente derivados, y segn la estructura factorial
resultante, se seala el descubrimiento de los aspectos subyacentes de una realidad
psicolgica. Se recuerda que la tcnica debe estar sometida a los intereses conceptuales
y que un agrupamiento de tems es slo eso, un agrupamiento, y que aunque empri-
camente relevante, puede carecer de significado psicolgico. Los factores no psicol-
gicos que pueden hacer que unos tems aparezcan juntos son tantos que la aplicacin
de esta tcnica de anlisis en el vaco terico es totalmente improductiva e ineficaz, no
recomendndose su uso en estas condiciones (Nunnally y Bernstein, 1995). Dado lo
apuntado, viene a recordarse que los procedimientos exploratorios sirven para inda-
gar y que, por lo tanto, esta indagacin debe ser posteriormente sometida a confirma-
cin. As, aunque el autor deber informar sobre los criterios tomados en cuenta para
concluir sobre qu factores y cuntos son vistos como determinantes (vase una revi-
sin en Ferrando, 1996 o Martnez-Arias, 1995), estos criterios debern verse relacio-
nados en la discusin con referentes tericos, a la vez que se declara la momentaneidad
de las conclusiones hasta que la replicacin sea suficiente y la confirmacin de la
hiptesis llevada a cabo.
Cuando el objetivo es confirmar si la estructura emprica de la escala se corres-
ponde con la terica, la tcnica de anlisis no debe ser exploratoria. Aunque en los
ltimos aos est observndose un incremento en el uso de los procedimiento
confirmatorios en la publicaciones referentes a la creacin/adaptacin de tests, su uso
an est poco generalizado, siendo lo comn la aplicacin de procedimientos exploratorios
(Batista-Foguet, Coenders y Alonso, 2004). No es este el espacio para explicar el uso
de estrategias confirmatorias a travs de los modelos de ecuaciones estructurales (se le
recomienda al lector el trabajo de Batista-Foguet y Coenders, 2000); sin embargo, s se
resaltan las etapas que el encargado de su aplicacin debe considerar (Batista-Foguet
et al., 2004) y los datos que deben hacerse explcitos al publicar los resultados. El autor
debe especificar claramente cul es el modelo (forma en la que los tems se agrupan)
que pretende someterse a prueba, recomendndose el uso simultneo de otros modelos
alternativos para analizar el ajuste comparativo, y facilitando la informacin que ase-
gure que los modelos pueden ser contrastados en funcin de los requisitos de las
ecuaciones estructurales. El tamao de la muestra debe ser adecuado para este tipo de
anlisis. As, no debe aplicarse este mtodo de anlisis con muestras inferiores a 200
participantes, aunque depender del nmero de tems, componentes propuestos, etc.
(Batista-Foguet et al., 2004). Una vez especificado el o los modelos, comprobado que
la aplicacin de la tcnica es posible y que la muestra es adecuada, debe seleccionarse
el mtodo de estimacin a usar para concluir si lo tericamente propuesto se ajusta a
los datos empricos. Cuando se usan tems con una escala de respuesta tipo Likert, la
recomendacin es tratar a las puntuaciones como datos categoriales no continuos, ya
que son en realidad las propiedades de dichas puntuaciones (Jreskog y Srbom, 1993).
o que puedan usarse para el objetivo inicialmente planteado. Para llegar a esta conclu-
sin es necesario obtener las pertinentes evidencias externas de validez. Las evidencias
de validez externa deben basarse en el estudio de las relaciones entre el test y a) un
criterio que se espera prediga ste (validez de criterio), b) otros tests que supuestamente
miden lo mismo o con otros constructos con los que tendra que mostrar relacin
(validez convergente); y c) otras variables tericamente relevantes y de las que debera
diferenciarse (validez discriminante) (AERA et al., 1999). Como puede deducirse, cuando
se habla de evidencias externas de validez se produce una vuelta a la elaboracin
terica inicial. De hecho, se tratara de establecer si aparecen las relaciones tericamen-
te predichas entre las puntuaciones obtenidas con el instrumento de evaluacin y otras
variables externas delimitadas como importantes para el constructo evaluado. As, el
anlisis de la validez externa de las puntuaciones de un test no es ni ms ni menos que
el intento por ubicar al constructo en un entramado terico significativo, dndole
coherencia psicolgica. De esta forma, estos estudios supondran el soporte a partir
del cual interpretar las puntuaciones de la herramienta de evaluacin y, por lo tanto, el
modo de otorgar significado psicolgico a un dato numrico (Paz, 1996). Los autores
de este artculo quieren advertir algo que con frecuencia suele ser pasado por alto.
Llegados a este momento del proceso de construccin/adaptacin de un test, lo que los
estudios siguientes deben aportar no es algo exclusivo de la tarea que supone esta
construccin o adaptacin. Lo que quiere decirse es que en cualquier campo de inves-
tigacin, al estudiar una dimensin, se busca integrar sta en un esquema general que
le d sentido y donde pueda drsele utilidad y significado. De esta forma, el estudio de
la faceta psicolgica que sea, tiene que enmarcarse en una tradicin emprica y terica
previa, para posteriormente proceder a analizar si la propuesta resulta adecuada (vali-
dacin). Con esto viene a sostenerse que el proceso de validacin asentado en estos
objetivos no es algo que se observe slo dentro de esta fase de construccin/adaptacin
de un test, sino que debe tratarse ms como una finalidad y quehacer comn dentro de
una disciplina cientfica. As, esto tiene su reflejo en que no hay una metodologa de
estudio particular para esta tarea de validacin externa de un instrumento, sino que la
clave son las relaciones tericamente propuestas como significativas, aplicndose la
metodologa y diseo ms conveniente (experimental, cuasi-experimental o no experi-
mental), en funcin de los intereses tericos.
Para la elaboracin o revisin de un trabajo dirigido a la obtencin de evidencias
externas de validez de un test, los autores deben justificar ste a partir de las teoras
de referencia y resultados de investigacin previos (lo cual debera estar concretado en
la definicin sintctica de la variable realizada en las primeras fases de construccin/
adaptacin), y su puesta en marcha debe seguir los criterios consensuados para cual-
quier investigacin (Bobenrieth, 2002), adems de tener en cuenta los particulares de
la metodologa concreta que haya decidido usarse, como por ejemplo la experimental
(Ramos-lvarez y Catena, 2004). Este es el motivo por el que para esta fase en cues-
tin no podr observarse al finalizar el informe una tabla resumen dedicada a los
aspectos ms sustantivos de sta, remitindose al lector a los trabajos ya citados
(Bobenrieth, 2002; Ramos-lvarez y Catena, 2004) o a cualquier otro encargado de
tratar las normas para la publicacin de artculos en Ciencias del Comportamiento.
sobre una variable de inters. Sin embargo, no est exento de problemas, y el autor
deber justificar su uso y reflexionar sobre sus condiciones de aplicacin y verdaderas
aportaciones a la hora discutir los resultados (vase Martnez-Arias, 1995 o Nunnally
y Bernstein, 1995 para un anlisis de los factores a tener en cuenta a la hora de usar
el anlisis de regresin lineal simple y mltiple). A pesar de haberse destacado el uso
del anlisis de regresin lineal, no debera perderse de vista que esta tcnica de anlisis
no agota las posibilidades. As, y aunque dependiendo del nmero de variables y de sus
particularidades mtricas, el hecho es que lo habitual sera poder acudir a casi la
totalidad de tcnicas de anlisis multivariado, por lo que el investigador debera ser
conocedor de las caractersticas principales de cada una de stas, para as aplicarlas en
las circunstancias adecuadas (vase Muiz, 1998 para profundizar en el uso de estas
tcnicas dentro de los estudios de validez externa).
Para finalizar los comentarios referidos a la obtencin de evidencias externas de
validez habra que hacer una reflexin sobre un aspecto muy tratado en los ltimos
estndares para la creacin de tests psicolgicos y educativos (AERA et al.,1999). Se
trata del estudio dirigido a explorar si las evidencias de validez obtenidas para deter-
minadas muestras y en contextos concretos pueden generalizarse sin necesidad de nuevos
estudios de validez. Aqu el problema residira en que los coeficientes de validez ob-
tenidos se ven afectados por la variabilidad de las muestras, los distintos instrumentos
usados, criterios considerados en cada estudio, etc. As, el objetivo es determinar si la
variacin en dichos coeficientes es simplemente producto de estas influencias inevi-
tables, o bien existen otras variables no tenidas en cuenta y que deberan ser pues
incluidas dentro de los estudio de validez del instrumento en cuestin. Para este obje-
tivo la propuesta se ha centrado en hacer uso de variaciones del meta-anlisis tradicio-
nal y que viene a suponer ms que una puesta en comn y equiparacin de los
resultados logrados en diversos estudios. Como puede deducirse, las conclusiones son
tomadas cuando stas se ven precedidas por un amplio bagaje de resultados y, por lo
tanto, por un conjunto de estudios numeroso. Esto de nuevo pone de relieve que hasta
que un test cuenta con todas las evidencias necesarias de validez interna y externa,
junto con las encargadas de reflejar la fiabilidad, las fases a seguir son varias, su puesta
en marcha debe ser repetida y el tiempo que se necesita es igualmente elevado. As,
no hay test fiable y vlido sin un trabajo estructurado, sistemtico y prolongado de-
trs.
Referencias
AERA, APA y NCME (1999). Standards for educational and psychological tests. Washington
DC: American Psychological Association, American Educational Research Association,
National Council on Measurement in Education.
Barbero, M.I. (2003). Psicometra. Madrid: Universidad Nacional de Educacin a Distancia.
Batista-Foguet, J.M. y Coenders, G. (2000). Modelos de ecuaciones estructurales. Madrid: La
Muralla.
Batista-Foguet, J.M., Coenders, G. y Alonso, J. (2004). Anlisis factorial confirmatorio. Su uti-
lidad en la validacin de cuestionarios relacionados con la salud. Medicina Clnica, 122,
21-27.
Haynes, S.N., Richard, D.C.S. y Kubany, E.S. (1995). Content validity in psychological assessment:
A functional approach to concepts and methods. Psychological Assessment, 7, 238-247.
Jackson, D.N. (1970). A sequential system for personality scale development. En C.D. Spielberger
(Ed.), Current topics in clinical and community psychology (vol. 2) (pp. 61-96). Nueva
York: Academic Press.
Jreskog, K.G. y Srbom, D. (1993). LISREL 8. Users referente guide. Chicago, IL: Scientific
Software.
Loevinger, J. (1957). Objective tests as instruments of psychological theory. Psychological Reports,
3, 635-694.
Lord, F.M. y Novick, M.R. (1968). Statistical theories of mental test scores. Reading, MA:
Addison Wesley.
Lynn, M. (1986). Determination and quantification of content validity. Nursing Research, 35,
382-385.
Martnez-Arias, R. (1995). Psicometra: teora de los test psicolgicos y educativos. Madrid:
Sntesis.
Montero, I. y Len, O. (2002). Clasificacin y descripcin de las metodologas de investigacin
en Psicologa. Revista Internacional de Psicologa Clnica y de la Salud/Internacional
Journal of Clinical and Health Psychology, 2, 503-508.
Montero, I. y Len, O.G. (2005). Sistema de clasificacin del mtodo en los informes de inves-
tigacin en Psicologa. Internacional Journal of Clinical and Health Psychology, 5, 115-
127.
Muiz, J. (1998). Teora clsica de los tests. Madrid: Pirmide.
Muiz, J. y Hambleton, R.K. (1996). Directrices para la traduccin y adaptacin de los tests.
Papeles del Psiclogo, 66, 63-70.
Muiz, J. y Hambleton, R.K. (2000). Adaptacin de los tests de unas culturas a otras. Metodo-
loga de las Ciencias del Comportamiento, 2, 129-149.
Murphy, K.R. y Davidshofer, C.O. (1994). Psychological testing: Principles and applications (3
ed.). Englewood Cliffs, NJ: Prentice-Hall.
Navas, M.J. (2001). Mtodos, diseos y tcnicas de investigacin psicolgica. Madrid: Univer-
sidad Nacional de Educacin a Distancia.
Nunnally, J.C. y Bernstein, I.J. (1995). Teora psicomtrica. Madrid: McGraw-Hill.
Osterlind, S.J. (1989). Constructing Test Items. Londres: Kluwer Academic Publishers.
Paunonen, S.V. y Ashton, M.C. (2001). Big Five factors and facets and the prediction of behavior.
Journal of Personality and Social Psychology, 81, 524-539.
Paz, M.D. (1996). Validez. En J. Muiz (Ed.), Psicometra (pp. 499-103). Madrid: Universitas.
Pelechano, V. (1997). Prlogo. En G. Buela-Casal y J.C. Sierra (dirs.), Manual de evaluacin
psicolgica. Fundamentos, tcnicas y aplicaciones (pp. 31-35). Madrid: Siglo XXI.
Pelechano, V. (2002). Valoracin de la actividad cientfica en psicologa? Pseudoproblema,
sociologismo o ideologismo? Analisis y Modificacion de Conducta, 28, 323-362.
Prieto, G. y Delgado, A.R. (1996). Construccin de los tems. En J. Muiz (Ed.), Psicometra
(pp. 139-170). Madrid: Universitas.
Ramos-lvarez, M.M. y Catena, A. (2004). Normas para la elaboracin y revisin de artculos
originales experimentales en Ciencias del Comportamiento. International Journal of Clinical
and Health Psychology, 4, 173-189.
Rubio, D.M., Berg-Weger, M., Tebb, S.S., Lee, E.S. y Rauch, S. (2003). Objectifying content
validity: Conducting a content validity study in social work research. Social Work Research,
27, 94-104.
Sireci, S.G. (1998). Gathering and analyzing content validity data. Educational Measurement, 5,
299-321.
Smith, G.T., Fischer, S. y Fister, S.M. (2003). Incremental validity principles in test construction.
Psychological Assessment, 15, 467-477.
Smith, G.T., y McCarthy, D.N. (1995). Methodological considerations in the refinement of clinical
assessment instruments. Psychological Assessment, 7, 300-308.
Snook, S.C. y Gorsuch, R.L. (1989). Component analysis versus common factor analysis: A
Monte Carlo study. Psychological Bulletin, 106, 148-154.
Stevens, J. (1992). Applied multivariate statistics for the social sciences. Hillsdale, NJ: Lawrence
Erlbaum.
Tanaka, J.S. (1993). Multifaceted conceptions of fit in structural models. En K.A. Bollen y J.S.
Long (Eds.), Testing Structural Equation Models (pp. 10-39). Thousand Oaks: Sage.
Traub, R.E. (1994). Reliability for the social sciences: Theory and applications. Londres: Sage.
Walsh, W.B. (1995). Tests and assessment. Nueva York: Prentice-Hall.
Whiteside, S.P. y Lynam, D. R. (2001). The five factor model and impulsivity: Using a structural
model of personality to understand impulsivity. Personality and Individual Differences,
30, 669-689.
DELIMITACIN CONCEPTUAL
DELIMITACIN CONCEPTUALDEL CONSTRUCTO A EVALUARA(B)EVALUAR (B)
DEL CONSTRUCTO
S Dudoso No
B.1. Aparecen claramente especificados los intentos de conceptuacin ms
relevantes del constructo de inters.
B.2. Las distintas propuestas conceptuales se presentan integradas en uno o
varios marcos tericos de referencia.
B.3. Se hace una revisin de los principales instrumentos de evaluacin
encargados de evaluar a ste o a constructos relacionados.
B.4. Tras la revisin se realiza una propuesta operativa de las facetas o
componentes operativos del constructo a evaluar, la cual es sometida a
evaluacin a travs de expertos.
B.5. Se presenta detalladamente la informacin relacionada con el juicio de
expertos (seleccin de expertos, material utilizado, forma de evaluar,
etc.)
B.6. Considerando los resultados de la evaluacin de los expertos, los datos
de investigacin y los marcos tericos de referencia, se concreta
definitivamente la definicin operativa del constructo.
B.7. Teniendo en cuenta la definicin adoptada del constructo, se concretan
las relaciones esperadas entre ste y otras variables.
B.8. Las relaciones predichas para la puntuacin total en el constructo estn
adecuadamente justificadas.
B.9. En el caso de que el constructo est compuesto por distintas facetas o
componentes tambin son establecidas las relaciones esperadas para
cada uno de estos componentes.
B.10. Las relaciones predichas se presentan claras, especificndose cuando el
constructo va ser variable predictora, cuando predicha y cuando
covariado.
S Dudoso No
C.1. La informacin que justifica el tipo de tems a construir (incluyendo
formato, tipo de redaccin, escala de respuesta, etc.) es presentada con
claridad.
C.2. El autor hace uso de una tabla de especificaciones de los tems para
guiar la elaboracin de stos.
C.3. La tabla de especificaciones de los tems recoge toda la informacin
necesaria para la construccin de stos.
Anlisis estadstico
ANLISIS de los tems (D)
ESTADSTICO DE LOS TEMS (D)
S Dudoso No
D.1. La delimitacin del trabajo es clara (primer estudio de los tems, estudio
piloto o validacin cruzada)
D.2. Los objetivos del anlisis aparecen claramente especificados
(homogeneidad y consistencia de la escala frente a validez de criterio).
D.3. Es facilitada toda la informacin referente a los tems, instrucciones a
los participantes, contexto de aplicacin, etc.
D.4. La muestra de estudio tiene caractersticas similares a las de la
poblacin objetivo del test.
D.5. El tamao de la muestra es adecuado para los objetivos del estudio.
D.6. El procedimiento de evaluacin es similar al que se tiene planificado
para la escala definitiva (muestreo).
C.7. Se especifican con claridad los criterios a considerar para la seleccin-
eliminacin de los tems.
C.8. Los clculos estadsticos efectuados resultan pertinentes.
C.9. Los resultados (cualitativos y cuantitativos) se discuten con claridad.
C.10. Las decisiones sobre los tems tienen en cuenta cuestiones tericas.
C.11. Se especifica claramente que tems son eliminados y por qu.
C.12. Los tems seleccionados quedan claramente delimitados.
ESTUDIO
Estudio de laDE LA DIMENSIONALIDAD
dimensionalidad DEL interna)
del instrumento (estructura INSTRUMENTO
(E) (ESTRUCTURA
INTERNA) (E)
S Dudoso No
E.1. La delimitacin del trabajo es clara (primer estudio de dimensionalidad
de la escala o validacin cruzada de resultados previos).
E.2. Los objetivos del anlisis aparecen claramente especificados (estudio
exploratorio frente a anlisis confirmatorio, o ambos).
E.3. La informacin presentada sirve para justificar con claridad los
objetivos propuestos.
E.4. Es facilitada toda la informacin necesaria para que el lector conozca
los antecedentes que justifican la escala y la dimensionalidad esperada
de sta.
E.5. La informacin sobre la muestra es completa y pertinente.