You are on page 1of 27

VALIDEZ Y

CONFIABILIDAD

La p
ro
la re blemti
ca a
colec
l
reali
zaci cin de moment
o de
n de
inve
dato
stiga
s en
los
c i n
c o ns
T
trucc
se c rabajos la
i
instr
entra
de
ume n
en
ntos
esta
de
la
f
a
n
alida
emp
perm
lo s
d
lear
, de
itan
vlid
con
a y recabar manera
valor
que
conf
infor
d
a
m
e un
ble.
acin
q ue
e
P
st
or
INTR
e
ms sta info udio dep que el
ODU
r
e
m
f
n
C
d
aci
de
ed
CIO
inve
N
stiga igname n refe de
n
j
d
e
te e
real
o
lo
l ev
para , dndo
ento
inve
stiga obtener le una
base
tivo
un p
de c
rodu
alida
cto
d.

MEDICION: EN QU CONSISTE?
Longitu
d

Peso

La medicin es un mtodo que


permite establecer correspondencias
entre magnitudes de un mismo
gnero, y ciertas clases de nmeros
(integrales, racionales o reales) en
Russell (1938)
Medir es parte de nuestro vivir.
Bostwick, (2005).

Medir signifca asignar nmeros, smbolos o valores a las


propiedades de objetos de acuerdo a ciertas reglas. Stevens
(1951).
Actualmente se concibe a la medicin como al proceso de vincular
conceptos abstractos con indicadores empricos Carmines (1991).

Y qu es un
instrumento de
medicin?
Es el recurso que se utiliza para
registrar la informacin que se

Tiemp
o

VA
LI
DE
Z
Y
CO
NF
IA
BIL
ID
AD

Todo instrumento de medicin cientfca tiene que cumplir con dos


principios bsicos:

ser vlido y ser confiable.


Ser vlido signifca que un
instrumento es vlido para
una esfera de
comportamientos si nos
permite predecir rendimiento
dentro de esa esfera,
independientemente del
nombre de la prueba, del
rasgo o rasgos que se dice
que mide. Por ejemplo,
diremos que una regla mide
centmetros, o bien la
distancia lineal entre dos
puntos, y ser vlida para
medir la distancia entre dos
puntos lineales, pero no es
vlida para medir la extensin
LA VALIDEZ se refere al grado en que un
de la lnea de un crculo.

Ser confiable signifca que


un instrumento de medicin
independiente de su objetivo,
siempre debe medir lo
mismo, bajo las mismas
condiciones..
LA CONFIABILIDAD de un
instrumento de medicin se
refere al grado de precisin
o
exactitud de la medida, en el
sentido de que si aplicamos
repetidamente el
instrumento al mismo sujeto
u objeto produce iguales
resultados.

instrumento mide la variable que pretende medir.

La validez y confiabilidad siempre est limitada segn sea la evidencia disponible,


permitiendo afirmar que determinado instrumento es vlido y confiable para
determinado uso y bajo ciertas condiciones.
FACTORES QUE PUEDEN AFECTAR LA CONFIABILIDAD Y LA VALIDEZ
a) La improvisacin. Algunas personas creen que elegir un
instrumento de medicin o desarrollar uno es algo fcil y que
no requiere de supervisin alguna. Para poder construir un
instrumento se requiere conocer muy bien la variable que se
pretende medir y la teora que la sustenta.
b) El no estar validados en el contexto donde se aplican.
Traducir un instrumento, an cuando adaptemos los trminos
a nuestro lenguaje no es ni remotamente validarlo. Es
simplemente un primer paso ya que validar un instrumento
implica realizar una investigacin extensa y compleja. Los
grupos, las personas cambian y tienen valores diferentes de
acuerdo a la cultura. Por lo tanto, se deben aplicar
instrumentos ya validados en el contexto.
c) El instrumento e inadecuado o no es emptico. Hay
instrumentos que tienen un lenguaje muy elevado para el
entrevistado o no toma en cuenta diferencias de sexo, edad
nivel ocupacional y educativo; todo esto puede resultar en
errores de validez y confiabilidad del instrumento de medicin

d) Condiciones en que se aplica el


instrumento. El ruido, presionar para
que una persona conteste un
instrumento largo en un perodo de
tiempo corto, el hambre o falta de
motivacin para responder influir
negativamente en la validez
y confiabilidad de la medida.
e) Aspectos mecnicos. Que el
instrumento
tenga
instrucciones
precisas, que se lea bien (si se trata de
un cuestionario escrito), que no le
falten pginas, que haya un espacio
adecuado para contestar.

CMO SE SABE SI UN INSTRUMENTO ES CONFIABLE Y VLIDO?


En la prctica es casi imposible que una medicin sea perfecta, generalmente se tiene un
grado de error. Desde luego, se trata que este error sea el mnimo posible y para ello hay
formas de calcular la confabilidad y la validez.

Para

la

confiabilidad,

generalmente todos los


procedimientos utilizan frmulas que producen coefcientes
de confabilidad, los cuales pueden oscilar entre 0 y 1,
donde 0 signifca confabilidad nula y 1 representa el mximo
de confabilidad. Entre ms se acerque el coefciente a 0
habr mayor error en la medicin. Los procedimientos ms
utilizados son:

Medida de estabilidad (confabilidad por testretest). Un mismo instrumento es aplicado dos o ms


veces a un mismo grupo de personas.
Medidas paralelas o formas equivalentes de
medir. En este procedimiento no se aplica el mismo
instrumento de medicin sino dos o ms versiones
equivalentes de ste.
Mtodo de mitades divididas. Aqu se administra
un solo instrumento, una sola vez, pero se dividen las
preguntas o los items
Cotejo entre observadores. Se utiliza
fundamentalmente cuando se aplican instrumentos de
observacin y registro. Dos o ms observadores
aplican el mismo instrumento al mismo tiempo.

Para calcular la
validez, la validez que

ms interesa obtener en
una investigacin es la
validez de contenido.
Para obtener validez de
contenido primero que
nada hace falta revisar
como ha sido tratada esta
variable por otros
investigadores
anteriormente. Segundo,
elaborar un universo de
items tan amplio como sea
posible, para medir la
variable en todas
sus dimensiones.
Posteriormente, se consulta
con investigadores
familiarizados con el tema
y la variable a medir para
ver si el contenido es
exhaustivo. Esto se conoce
con el nombre
de validacin por
expertos.

VALIDEZ. Definicin
A. La
C
I
G
de
L
z
n
a
e
l
o
s
d
e
d
es
vali
opio a cul ntos,
a
r
p
L
epto os ense onamie
c
n
un
o
z
c
n
a
r
n
e
u
u
s
nto
z, es iencia q ez de lo iciones.
a
e
l
e
d
e
i
m
l
c
d
d
s
i
a
r
tru
s
La v es una s de val s propo
cula extraer
i
n
t
i
r
a
a
a
en
e
l
ra
e
ap
a
t
n
lgic ndicion ias, de
i
p
s
l
i
r
p
i
c
ns
o
o
disc procede
c
a
lo
las c inferen
n
u
a
o
s
s
d
m
e
i
a
l

c
a
de
em
olog ensea
u
e
d
q
o
n
u
t
u
q
e
s
e
o
m
.
e
u
n
s
d
q
a
e
La
ien
t
n el n verda e
a qu es vlid
e
e
c
i
o
u
g
e
n
q
l
Grad mento le que s
ir
usio
l
d
c
e
n
u
b
r
a
t
co
i
m
n
r
i ns
)
d
a va r. Seg
o, l a
l
a
t
d
e
n
i
d
a
i
t
mi
tic
n
med 998)
e
, po r n
a
t
s
c
e
s
u
r
1
z

bu
(a
o po ce
ra (
alide oximaci d que
d
e
v
a
r
t
r
i
e
a
l
L
r
He
77, c ) estab
r ap a verda
9
o
j
1
(
e
9
a la
l
l
m
8
n
e
a
9
g
b
i
a
1
E
s
e
,
e
bl
un
ntes ez d e un
posi
ne r na
e
e
u
t
F
.
e
u
valid a con qu es de
sin
pued sicin,
e
u
l
u
c
q
on
o
ntaj quello
enci
r
u
e
p
prop ncia o c
h
a
de
co
e
den
i los ados en
nto
i
s
u
j
m
infer
a
n
co
ba
re
(p.
iliz
e
e
t
r
i
o
u
f
u
r
d
e
n
s
p
e
Se r mento n mide
una eben m
e
s
u

i
r
d
inst estigac tos que n.
que
a
a
j
v
.
la in en los d n o reco
103)
g
a
reco en mid
n
supo

VAL
CO IDEZ D
NT E
NID E
O

VALIDEZ . Tipos
LA VALIDEZ DE CONTENIDO se refiere al grado en que un
instrumento refleja un dominio especfico de contenido de lo que se
mide. Por ejemplo, una prueba de operaciones aritmticas no
tendr validez de contenido si explora suma y divisin y excluye
problemas de resta y multiplicacin. Un instrumento de medicin
debe contener representados a todos los items del dominio de
contenido de las variables a medir.
A travs de la validez de contenido se trata de determinar hasta
dnde los temes de un instrumento son representativos del
dominio o universo de contenido de la propiedad que se desea
medir. A diferencia de otros tipos de validez, la de contenido no
puede ser expresada cuantitativamente, a travs de un ndice o
coeficiente; ella es ms bien una cuestin de juicio. Es decir, la
validez de contenido, por lo general, se estima de manera subjetiva
o intersubjetiva. El procedimiento ms comnmente empleado para
determinar este tipo de validez, es el que se conoce con el nombre
de JUICIOS DE EXPERTOS,

RTOS
E
P
X
E
E
D
JUICIO
1. Se seleccionan dos jueces o expertos, por lo menos, a los fines de juzgar, de manera
independiente, la bondad de los temes del instrumento, en trminos de la relevancia o
congruencia de los reactivos con el universo de contenido, la claridad en la redaccin y la
tendenciosidad o sesgo en la formulacin de los temes.
2. Cada experto recibe suficiente informacin escrita acerca de: (a) el propsito de la prueba;
(b) conceptualizacin del universo de contenido; (c) plan de operacionalizacin o tabla de
especificaciones (en el caso de las pruebas de rendimiento acadmico).
3. Cada juez recibe un instrumento de validacin en el cual se recoge la informacin de cada
experto. Dicho instrumento normalmente contiene las siguientes categoras de informacin por
cada tem: congruencia tem-dominio, claridad, tendenciosidad y observaciones.
4. Se recogen y analizan los instrumentos de validacin y se toman las decisiones siguientes:
(a) los temes donde hay un 100 por ciento de coincidencia favorable entre los jueces (los
temes son congruentes, estn escritos claramente y no son tendenciosos) quedan incluido en
el instrumento; (b) los temes donde hay un 100 por ciento de coincidencia desfavorable entre
los jueces, quedan excluidos del instrumento; y (c) los temes donde slo hay coincidencia
parcial entre los jueces deben ser revisados, reformulados, si es necesario, y nuevamente
validados.

MET
ODO
GRU
S
PALE
S

Los juicios de expertos se pueden obtener por mtodos grupales o por mtodos de experto nico. Se pueden seguir:
Mtodo de Agregados Individuales: Se pide
individualmente a cada experto que d una estimacin
directa de los tems del instrumento. ste es un mtodo
econmico porque, al igual que el mtodo Delphi no
exige que se rena a los expertos en un lugar
determinado.
Mtodo Delphi: Este mtodo fue creado en 1948 para obtener
la opinin de expertos de una manera sistemtica. En un primer
momento, cada experto responde de manera individual y
annima a un cuestionario. Despus se analizan las respuestas
del conjunto de expertos, se remite a cada uno la respuesta
mediana obtenida, as como el intervalo intercuartil para cada
cuestin y se les pide que reconsideren su juicio anterior,
teniendo en cuenta estos datos.

Mtodo del Consenso Grupal: Se rene a los


expertos en un lugar determinado, se indica al
grupo que su tarea consiste en lograr una
estimacin de la pertinencia y otros aspectos
relacionados con la elaboracin de los temes, que
sea satisfactoria para todos los expertos. Con estas
instrucciones se maximizan los intercambios de
informacin y opiniones dentro del grupo de
expertos.

Tcnica de Grupo Nominal: El primer paso es reunir a los


expertos (entre ocho y diez personas) y pedirles que registren,
individualmente y sin intercambiar opiniones, sus propias
puntuaciones y consideraciones respecto a las probabilidades
de error para cada una de las preguntas o tareas que se les
detallan. Despus, cada experto expone a los dems las
puntuaciones y principales consideraciones registradas y al
acabar esta ronda, se establecen las coincidencias del grupo.
Luego se realiza un debate de cada uno de los apartados de
sta. Finalmente, cada experto, de manera individual y por
escrito, punta y argumenta las probabilidades de error para
cada tarea/pregunta considerada.

VAL
IDE
Z

LA VAL
ID
instrum EZ DE CRIT
e n t o se
ERIO
im
criterio
ajusta
o sirve plica que la
se ajus
medici
ta al fu
a un c
Por eje
n d el
t u ro s e
riterio
mplo u
externo
n a p ru e
habl a d
puede
. S
ba
co
e valid
ez pred i el
de los e mparar sus r de admisin
ictiva.
en
es
st
Se est udiantes en l ultados con e las universid
ac
ades
ab
l rendim
compa lece al valid arrera.
ie
n
t
o
futuro
r ar
ar un
instrum
lo mism lo con algn
ent o d
cr
o
e me d
las cam . Validez con iterio externo
ic
current
q
paas
u
e
pretend in al
e y la
elector
los res
e medir
va
ales, lo
ult
s sond lidez predict
de Co ados finales
iva. En
eos s e
ntin
de las
co m p a
eleccio
Cronba gencias, Sp
ra n
ne
e
ch y la
Tcnica arman Bro s. Ejm: Coefi con
ci
w, Pea
Aiken.
rson, A ente
Se e s t
lfa de
ud
(variab ia comparan
do
le
(variab independiente los puntajes
l es de
) c on u
de un
pendie
n
Es imp
instrum
a
o
ms va
n t e s) d
ento
ortante
r
enomin
iables e
estar a
destac
a
xtern
das
ar q ue
so
la valid variables crit as
decir, e ciada con pr
ob
e z p re
erio.
l
dictiva
desem inters no e lemas y resu
s
pe
s
lta
uele
resolve o en la pru tanto en lo q dos prctico
s; e s
r proble
e
u
mas pr ba, sino m e est detr
cticos
s bien
s
y t om a
en ayu del
r decis
dar a
iones.

DE

CRI

T ER

IO

Validez
Predictiva o de
Critrio Externo
o Emprica:

VALIDEZ DE
CONSTRUTO
LA VALIDEZ DE CONSTRUCTO es probablemente la
ms importante, sobretodo desde la perspectiva cientfica,
ya que se refiere al grado en que una medicin aportada
por un instrumento relaciona consistentemente con otras
mediciones que han surgido de hiptesis y construccin
de teoras antecedentes.
Debe explicar el modelo terico emprico que subyace a
La v
a
la variable de inters. Ejm: El Anlisis de Factores y
con lidez d
e
refi struct
Anlisis de Cofactores, el Anlisis de Covarianza.
ere
o se
Validez de constructo interesa cuando queremos utilizar el
de a a al gr
desempeo de los sujetos con el instrumento para inferir
lgi tingen ado
ca s
c
la posesin de ciertos rasgos o cualidades psicolgicas.
eg ia
cua
n la
Por ejemplo, en lugar de hablar de los puntajes que una
l
m
infe
i
persona obtuvo en un instrumento determinado, podemos
ren s
hablar de: (a) la actitud hacia la matemtica; (b) la
pue cias
d
leg
satisfaccin o disfrute con el aprendizaje de la
tima en,
men
matemtica; y (c) la valoracin o significado de la
te,
s
matemtica. Todas stas son cualidades hipotticas
real er
i
llamadas construcciones, cuya existencia se supone para
part zadas,
a
ir
explicar la conducta en muchas y diferentes situaciones ob
serv de mis
especficas.
a
sob ciones
re m
,
c

ons
tr

is
ucto
s.

VALIDEZ DE CONSTRUCTO DE UN INSTRUMENTO


1.

La relacin entre la conceptualizacin terica del instrumento y su estructura factorial. Por


ejemplo, en el desarrollo de la escala AC-2000, que mide el Autoconcepto de los alumnos de
sexto grado, Ruiz (1988) comprob, a travs de la tcnica del Anlisis Factorial, que las tres
dimensiones hiptetizadas en la escala (Autoconcepto Social, Autoconcepto Personal y
Autoconcepto Escolar) tenan soporte emprico en los datos (ver Cuadro 1).
Cronbach (1960) ha sugerido los pasos siguientes para establecer la validez de constructo: (a)
identificar las construcciones que pudieran explicar la ejecucin en el instrumento; (b) formulacin
de hiptesis comprobables a partir de la teora que enmarca a cada construccin; y (c) recopilacin
de datos para probar estas hiptesis. Estas hiptesis se pueden enunciar en relacin con
cualquiera de los siguientes tipos generales de evidencia (Thorndike, 1989; Helmstadter, 1964):
2. La informacin correlacional, esto es, que muestre las correlaciones entre la prueba bajo
estudio y otras medidas (pruebas o eventos en la vida real) que reflejen o dependan del
atributo en cuestin. Por ejemplo, en el mismo estudio de Ruiz (1988) se encontr una
correlacin de 0,79 entre el instrumento AC- 2000 y la escala de Auto-estima de Coopersmith
(1959).
3. Los datos sobre las diferencias entre grupos, comparando las
puntuaciones de prueba de
los subgrupos que se puede esperar difieren en el nivel del atributo. Por ejemplo, en el
desarrollo de una escala de Auto-concepto, se podra probar la hiptesis de que los
estudiantes con alto y bajo auto-concepto acadmico difieren en rendimiento escolar.
4. La informacin que muestre los efectos de tratamiento o intervenciones experimentales que se
puede esperar influyan en la expresin del atributo. Por ejemplo, existen evidencias en la
literatura que brindan soporte a la hiptesis de que una estrategia instruccional centrada en la
retroalimentacin positiva y crtica en las pruebas de evaluacin formativa, de estudiantes de
sexto grado, mejora el Auto-concepto de dichos alumnos
5. 5. Consistencia interna. En este sentido, podramos predecir correlaciones altas entre temes
debido a que todos ellos supuestamente miden el mismo constructo: Auto-concepto.

VALIDEZ TOTAL =VALIDEZ DE CONTENIDO + VALIDEZ DE


CRITERIO + VALIDEZ DE CONSTRUCTO

CONFIABILIDAD. Definicin
LA CONFIABILIDAD de un instrumento de medicin se
refere al grado de precisin o exactitud de la medida, en
el sentido de que si aplicamos repetidamente el
instrumento al mismo sujeto u objeto produce iguales
resultados. Es el caso de un balanza o de un termmetro,
los cuales sern confables si al pesarnos o medirnos la
temperatura en dos ocasiones seguidas, obtenemos los
mismos datos.
Antes de iniciar el trabajo de campo, es
imprescindible probar el cuestionario sobre un
pequeo grupo de poblacin. Esta prueba
piloto ha de garantizar las mismas condiciones
de realizacin que el trabajo de campo real. Se
recomienda un pequeo grupo de sujetos que
no pertenezcan a la muestra seleccionada pero
s a la poblacin o un grupo con caractersticas
similares a la de la muestra del estudio
Confiabilidad-grado en que un instrumento produce resultados consistentes. La
confiabilidad es una medida de determinacin de la ESTABILIDAD y la
CONSISTENCIA INTERNA DEL INSTRUMENTO.

El trmino confabilidad designa la exactitud con que un conjunto de puntajes


de pruebas miden lo que tendran que medir (Ebel, 1977, citado por Fuentes, op.
cit., p. 103). Entre los mtodos para estimar la confiabilidad, se
tienen:

Mtodos para estimar la Confiabilidad


MTODO TEST-RETEST: una forma de estimar la confiabilidad de un
test o cuestionario es administrarlo dos veces al mismo grupo y
correlacionar las puntuaciones obtenidas. Este mtodo tiene la
desventaja de que los puntajes pueden verse afectados por el recuerdo,
la prctica, etc. Este procedimiento no es adecuado para aplicarlo a
pruebas de conocimientos sino para la medicin de aptitudes fsicas y
atlticas, tests de personalidad y motores.
El coeficiente que se obtiene recibe el nombre de coeficiente de
estabilidad porque denota la coherencia de las puntuaciones en el
tiempo. Para un desarrollo adecuado y sean confiables deben variar
entre 0,80 y 0,95 (Popham, 1980, citado por Fuentes, op. cit.).
Se usa la correlacin por el mtodo de los puntajes directos
(Correlacin r de Pearson):
En donde:
rxy: es el coefciente de correlacin
N: nmero de sujetos
X: valores de X (1 aplicacin)
Y: valores de Y (2 aplicacin)
XY: producto de cada valor X por su
correspondiente valor en Y
Cuadro 2. Tabla de Datos para aplicar el
Coefciente de Correlacin r de Pearson.

TES
T

- RE
T ES
T

Descripcin del Mtodo


Mtodo: TEST RETEST

TEST - RETEST

Caractersticas:

El investigador debe aplicar el mismo


instrumento dos veces al mismo grupo
despus de cierto perodo.

Debe
calcular
la
instrumento ANTES
defnitiva del mismo.

Coefciente
altamente
confable.

confabilidad
del
de la aplicacin

de Correlacin
positivo
=

de Pearson
Instrumento

Debilidades:

El periodo de tiempo (corto


las mediciones puede
coefciente de confabilidad.

largo) entre
confundir el

Mtodos para estimar la Confiabilidad


Mtodo de formas alternativas o paralelas:
Aqu no se administra el mismo instrumento de
medicin, sino dos o ms versiones
equivalentes de este. Coeficiente de
correlacin producto-momento de Pearson.
Se administra el instrumento dos veces a la
misma poblacin. La segunda se cambia el
orden de preguntas y se construye una versin
equivalente a la primera se comparan para
determinar si son similares o discrepantes

Esto supone que las dos test mitades son paralelos, tienen igual
longitud y varianza entre s. Se estima a travs del coeficiente
de confiabilidad de Spearman-Brown:
i) Se establece la correlacin entre los dos puntajes de las dos
mitades del test a travs del mtodo de los puntajes directos,
Correlacin r de Pearson:

FOR
PAR MAS
ALE
LAS

ii) Estimacin del test completo (Spearman-Brown)


con la frmula:

Se interpreta la prueba de hemitest como coeficiente de


consistencia interna, ya que una sola prueba contiene las dos
formas equivalentes y su nfasis lo pone en las puntuaciones de
los sujetos, no en los temes.

Descripcin del Mtodo


FORMAS
PARALELAS
Mtodo: FORMAS EQUIVALENTES
Caractersticas:
Se administran dos o ms versiones equivalentes de un
mismo instrumento.
Deben ser similares en contenido, instrucciones, tipos de
preguntas y difcultad.
Son administradas al mismo grupo en un perodo
relativamente corto.
Los patrones de respuestas deben variar POCO entre las
aplicaciones.
Coefciente de Confabilidad = Frmula de Correlacin de
Pearson.
Debilidades:

Difcultad para obtener dos pruebas realmente paralelas

Implica doble trabajo

Confable solo si la correlacin entre los resultados de


ambas aplicaciones es positiva

Mtodos para estimar la Confiabilidad


SPL
IF
HAL
FM
ET H
SPLIF-HALF METHOD- se construye el
OD
instrumento con dos grupos de preguntas (pares
y nones) que midan igual. Se administra el
instrumento se determina el puntaje de los pares
y nones. Se le estima la correlacin y puntuacin.
A mayor la correlacin mas confiable se
considera el instrumento porque las preguntas
pares y nones reflejan puntaciones casi iguales.
El mtodo de mitades-partidas requiere slo una
aplicacin de la medicin. Especficamente, el
conjunto total de tems (o componentes) es
dividido en dos mitades y las puntuaciones o
resultados de ambas son comparados. Si el
instrumento es confiable, las puntuaciones de
ambas mitades deben estar fuertemente
correlacionadas. Un individuo con baja
puntuacin en una mitad, tender a tener
tambin una baja puntuacin en la otra mitad.

Mtodos para estimar la Confiabilidad


o la
d
a
d
iabili lear el
f
n
o
c
emp s de
r la
a
n
u

l
va
iva
om
t
e
c
a
l
a
n
s
r
r
Pa
s e de alte ; la cua
e
h
m
c
onba tas o te e trata o Likert bilidad
r
C
s
n
s tip ca confia de
fa de s pregu cuando
l
a
l
A
a
c
iente d de la onbach o las es 0 signifi ficiente
c
i
f
e
Co geneida de Cr
coe
de:
om
c
n
l
o
,
E
d
s
as:
o
a
,
a
f
.
l
m
l
c
1
m
r
i
a
a
o
t
o
y
f
m
h
iente policot entre 0 ilidad to de dos
c
i
f
e
co
ores
nfiab or medio
stas
l
o
e
a
c
u
v
p
res
mar resenta ulado p
o
t
e
c
pued y 1 rep e ser cal
d
nula ach pue
b
Cron
a) Mediante la varianza de los temes y la varianza del
puntaje total (Hernndez Sampieri et al, 2003)
Donde:
rtt : coeficiente de confiabilidad de la prueba o
cuestionario.
k: nmero de tems del instrumento.
st2: Varianza total del instrumento.
si2: Sumatoria de las varianzas de los tems.
Cuanto menor sea la variabilidad de respuesta, es
decir, que haya homogeneidad en las respuestas
dentro de cada tem, mayor ser el Alfa de Cronbach.

DE
A
F
AL
CH
A
B
N
CRO

b)
Mediante la matriz de correlacin de los
temes.

Donde:
n: Nmero de temes
p: Promedio de las correlaciones lineales
entre cada uno de los temes
Cuanto mayor sea la correlacin lineal
entre temes, mayor ser el alfa de
Cronbach.

Mtodos para estimar la Confiabilidad


0
2
R
EK
T
N
E
ICI
F
E
CO
Permite obtener la confiabilidad a partir de los datos
obtenidos en una sola aplicacin del test. Coeficiente de
consistencia interna. Puede ser usada en cuestionarios
de temes dicotmicos y cuando existen alternativas
dicotmicas con respuestas correctas e incorrectas.

Donde:
n: nmero total de temes
s2t: varianza de las puntuaciones totales
p: proporcin de sujetos que pasaron un
tem sobre el total de sujetos
q = 1- p

- 21
R
K
TE
N
E
I
FI C
E
O
C
permite obtener la confiabilidad a partir de los datos
obtenidos en una sola aplicacin del test. La
suposicin bsica es considerar que todos los temes
presentan
igual
varianza.
Coeficiente
de
consistencia interna.

Donde:
n: nmero total de temes
M: media aritmtica de las puntuaciones obtenidas
por los individuos
s2t: varianza de las puntuaciones totales

Descripcin del Mtodo


COEFI
DE
CIENT
ALFA
E KR-2
H
AC Alfa de Cronbach
Tcnica:
B
N
0
O
CR
Caractersticas:
Requiere slo una aplicacin del instrumento de
medicin.
Produce valores que oscilan entre cero (0) y uno (1).
No es necesario dividir en mitades los tems del
instrumento.
Se aplica la medicin y se calcula el coefciente.

Tcnica: Kuder Richardson KR - 20


Permite calcular la confabilidad con una sola aplicacin
del instrumento.
No requiere el diseo de pruebas paralelas.
Es aplicable slo en instrumentos
dicotmicos, que puedan ser codifcados
(correcto incorrecto, presente ausente,

con tems
con 1 0
a favor en

CUADRO RESUMEN
MTODO

TCNICA

PROPSITO

Test/retest

Coefciente r
correlacin de
Pearson

Consistencia en el
tiempo de los
puntajes

Formas Equivalentes

Coefciente r
correlacin de
Pearson

Estabilidad Temporal,
consistencia de las
respuestas.

Divisin por dos


mitades

Pearson/SpearmanBrown.
Ruln
Guttman

Homogeneidad de los
itemes al medir el
constructo

Anlisis de
homogeneidad de los
Itemes

KR 20

Coefcientes de
fabilidad como
consistencia interna
para itemes
dicotmicos (KR20).

Alfa de Cronbach

Homogeneidad de los
itemes con escala
tipo Lickert.

Confiabilidad

Una alta confiabilidad, por


si sola, no garantiza
buenos resultados
cientficos. Pero no puede
haber buenos
resultados cientficos sin
instrumentos confiables.
Carlos Ruiz Bolvar (2003)

PASOS PARA CREAR Y VALIDAR UN INSTRUMENTO DE MEDICIN

Listar las variables que se van a medir u observar.


Revisar la definicin conceptual de las variables.
Establecer la definicin operacional.
Elegir un instrumento ya desarrollado que se adaptar para el
estudio o crear un nuevo instrumento, tomando en cuenta las
dimensiones a medir y los indicadores especficos que se
utilizarn para cada una.
Indicar el nivel de medicin de cada tem o variable.
Establecer la forma en que se codificarn (darles un nmero que
represente) las variables o tems.
Aplicar una prueba piloto del instrumento.
Modificar el instrumento, a partir de los resultados de la prueba
piloto.

CONCLUSIN
La concepcin de validez est referida a la firmeza o seguridad de algn acto y las
condiciones necesarias para su permanencia, vigencia y autenticidad

La concepcin de confiabilidad de la evaluacin del aprendizaje, bajo el enfoque


cuantitativo, hace referencia a la estabilidad o consistencia interna en las tcnicas
e instrumentos; y reside en establecer la medida en que se puede replicar la
evaluacin: una exigencia al evaluador para que, utilizando otros mtodos y
estrategias, llegue a idnticos resultados. La prueba y el test alcanzan un elevado
coeficiente de confiabilidad si los errores de medida se minimizan; es decir,
cuando toda medida de confiabilidad indica qu proporcin de la varianza total de
las puntuaciones es varianza de error.

Tanto la validez como la confiabilidad se conjugan para coadyuvar al evaluador a


ser objetivo en el proceso de describir la realidad derivada de un aprendizaje
especfico, el cual est inmerso en un discurso privado y que pretende ser pblico
a travs de la comunicacin.

REFERENCIAS BIBLIOGRFICAS
s de

in

ig a c
ve s t

a
i n p

ra la

s so
ncia
s cie

n
in e
c
a
g
i
est

ciale

Psic

s, c

n,
dici
e
a
t
uar

ag
oped

oga

v
n.
a c i
de In
g
i
c l/
s
t
o
s
ve
od
vu s.
sy
t
n
n
o
i

i
d
n
e
M
.
ww
to d
98 ) .
Mto
oyec : http://w
0 3 ),
z (1 9 s p a a .
r
0
e
p
2
d
(
n
G.
en
.
e un
s,
ern ana de E
nes,
icin
2 00 6
i n d
d
Trilla s y F. H
c
e
c
E
:
i
u
d
r
B r io
F
c
a
.
e

ej e
to 8
r cer
ra m
ico D ., P. Col
agos
in y
/Inte
n. Te
l
Mx
c
l
n
L

i
i
a
e
,
r
c
H
a
o
a
nd
raw rado
s ti g
elab
Bue
M cG
Inve
cupe
r a la
:
e
a
a
l
a
R
p

a
les.
to s
a de
E sp
ocia
men
olog
e
S
l
d
s
o
E
t
a
.
i
. Me
0 06)
ienc
003 ) r es.
2
a s ( 2 n en C
(
u
a
a
C
ci
ptist na Edito
stiga
y Ba
z
Inve
e
rica
ml
nd
am e
n
r
r
d .h t
e
e
t
a
-inv
F
n
d
i
I
,
/
l
i
l
il
ez
n-la
ab
H
d
i
e
f
n
n
w

s
a
nt o
-y-co
H e r n : M cG r
o
ume
l i d ez
c
r
a
i
t
v
x
/
s
M
2/11
e-in
/ 201
d-d
m
:
a
b
o
d
d
e
c
i
a
.
l
W
pot
abi
bilid
inas
lo g s
nfia
onfi
b
o
c
.
Pa g
g
C
i
y
t
ez y
ves
s-de
dez
n to
Valid esisdein
vali
/
e
e
l
m
u
://t
stru
/ma
ad
http
s-in
net
bilid
.
o
l
a
e
i
f
r
C on
z-de
sha
lide
ez y
lide
a
s
d
a
i
.
v
l
v
i
a
w
V
w
itat
d-y
s.
://w
a nt
ilida
d at o
b
e
http cin-cu
a
d
onfi
cin
ga
o le c
LA/c
esti
c
O
e
I
r
V
ra la
/UR
ad
4]
net
s p a e en]
bilid
.
o
a
t
e
i
/201
f
r
n
3
n
l
e
a
0
o
b
h
/
i
m
C
s
tr u
pon
el 11
ez y
lide
s ins 33. [Dis
ado
o
l
r
Valid /www.s
e
e
p
d
:/
e cu
9 N
da d
http eccin
vol 1 2.pdf [R
abili
i
,
f
a
n
p
l
1
o
y co
a eta /n33/art
-rec
lidez segund
a
a
t
V
s
i
/rev
09 ) .
in.
ci o n
a ( 20 educac
a
r
i
c
d
u
a
e/ed
a l, Y
d e la
du.v
e
Corr iencias
.
c
u
.
.C
o .b c
R ev
rvici
e
s
/
/
:
http
ic a
t c n

You might also like