Professional Documents
Culture Documents
de
signicacin
estads2ca
Andrs
Espejo
Inferencia
Estads2ca
En
las
muestras
los
promedios
de
los
grupos
o
porcentajes
al
interior
de
las
tablas
nunca
sern
iguales.
Si
extraemos
una
segunda
muestra
de
la
poblacin,
obtendremos
siempre
resultados
diferentes.
Soluciones
-Pruebas
de
signicacin
(Pruebas
de
hiptesis)
-Construccin
de
modelos
predic2vos
TABLAS DE CONTINGENCIA
Cuando se trabaja con variables categricas, los datos suelen organizarse en tablas de doble entrada en las que cada entrada representa un criterio de clasicacin (una variable categrica). Como resultado de esta clasicacin, las frecuencias (el nmero o porcentaje de casos) aparecen organizadas en casillas que con2enen informacin sobre la relacin existente entre amboscriterios. A estas tablas de frecuencias se les llama tablas de con2ngencia (CROSSTABS).
La nalidad de una tabla de con2ngencia es mostrar la relacin (o ausencia de la misma) entre dos variables
Aunque parece que hay una cierta relacin entre dos variables, Existe alguna razn para creer que las diferencias en la iden2cacin pol2ca y las diferencias de genero son ms que una variacin aleatoria?
Existen varias pruebas disponibles para determinar si la relacin entre dos variables de tablas de con2ngencia es signica2va.
Variables NOMINALES
Chi cuadrado
CHISQ proporciona el estads2co X2 o ji-cuadrado, propuesto por Pearson, que permite contrastar la hiptesis de que las variables de la y columna son independientes. El valor real del estads2co no es muy informa2vo. El valor de signicacin (sig. Asint2ca) con2ene la informacin que estamos buscando. Cuanto menor sea el valor de signicacin, menor habr de que las dos variables sean independientes (no estn relacionadas)
Prueba de Hiptesis
H 0 Asociacin = 0 H 1 Asociacin 0
Advertencias:
no
hace
dis2ncin
de
pruebas
de
una
o
dos
colas.
slo
indica
si
las
variables
estn
asociadas.
no
mide
intensidad
de
la
asociacin.
Clculo de la Prueba
( fo fe) = fe
2
(MrgFila * MrgCol) FE = n
Clculo de la Prueba
( fo fe) = fe
2
En SPSS
Si queremos que calcular alguna medida de asociacin para variables NOMINALES, presionar ESTADSTICOS en el men de la tabla de contingencia.
2 3
Andrs Espejo
En este caso, el valor de signicacin aparece ,000, (Tiene que ser menor que 0,05) lo que quiere decir que las dos variables estn relacionadas.
Desventajas
del
No
evala
sen2do
de
la
asociacin.
No
evala
intensidad
de
asociacin.
No
acepta
ms
de
25%
de
casillas
con
frecuencias
inferiores
a
5.
La solucin esta en trabajar con otros estads2cos que estan basados o son correcciones del
tomar un valor entre 0 y 1, y para minimizar el efecto del tamao de la muestra sobre la cuan2cacin del grado de asociacin.
MEDIDAS BASADAS EN CHI CUADRADO Son medidas que intentan corregir l valor del estads2co X2 para hacerle e
/STATISTIC=CC: El Coeciente de con2ngencia toma valores entre 0 y 1, pero diicilmente llega a 1. Su valor mximo depende del nmero de las y de columnas. Un coeciente de 0 indica independencia, mientras que un coeciente que alcanza su valor mximo indica asociacin perfecta. /STATISTIC=PHI: Phi y V de Cramer. En tablas de con2ngencia 22, phi adopta valores entre 0 y 1, y su valor es idn2co al del coeciente de correlacin de Pearson. En tablas en las que una de las variables 2ene ms de dos niveles, phi puede tomar valores mayores que 1 (pues el valor de X2 puede ser mayor que el tamao muestral). La V de Cramer incluye una ligera modicacin de phi, y nunca excede de 1. En tablas de con2ngencia 22, los valores de la VCramer y phi son idn2cos.
Variables ORDINALES
Con datos ordinales ya 2ene sen2do hablar de la direccin de la relacin: Una relacin posi2va indica que los valores altos de una variable se asocian con los valores altos de la otra, y los valores bajos, con valores bajos; una relacin nega2va indica que los valores altos de una variable se asocian con los valores bajos de la otra, y los valores bajos con valores altos.
/STATISTIC=GAMMA: Uno de los coecientes ms conocidos es el coeciente gamma de Goodman y Kruskal. As pues, gamma oscila entre -1 y 1. Si dos variables son estads2camente independientes, gamma vale cero; pero un gamma de cero no implica independencia (excepto en tablas de con2ngencia 22). /STATISTIC=D: d de Somers. Cuando una de las variables se considera independiente (X) y la otra dependiente (Y), Somers ha propuesto una modicacin del coeciente D. Que consiste en aadir en el denominador de gamma el nmero de pares empatados en la variable dependiente. /STATISTIC=BTAU: Tau-b de Kendall. Tanto el coeciente tau-b como el tau-c 2enen en cuenta el nmero de empates, pero de dis2nta manera. El coeciente tau-b toma valores entre -1 y +1 slo en tablas de con2ngencia cuadradas y si ninguna frecuencia marginal vale cero. /STATISTIC=CTAU: Tau-c de Kendall. Tau-c toma valores entre aproximadamente -1 y +1 sea cual sea el nmero de las y de columnas de la tabla.
Resumen
Correlacin
El
coeciente
de
correlacin
de
Spearman
es
una
medida
de
asociacin
lineal,
para
variables
ordinales.
Establece
la
magnitud
y
la
direccin
de
la
relacin
El
coecientes
de
correlacin
de
Pearson
es
una
medida
de
asociacin
lineal
especialmente
apropiada
para
estudiar
la
relacin
entre
variables
de
intervalo
o
razn.
Ambos
coecientes
poseen
escasa
u2lidad
para
estudiar
las
pautas
de
relacin
presentes
en
una
tabla
de
con2ngencia
ppica,
pues
lo
habitual
es
u2lizar
las
tablas
de
con2ngencia
para
cruzar
variables
de
2po
nominal
o,
a
lo
sumo,
de
2po
ordinal
con
slo
unos
pocos
niveles.
Se
interpreta
el
valor
del
coeciente
1=
relacin
lineal
mxima,
directa
y
-1=relacin
lineal
mxima,
indirecta
Variables ORDINALES
Andrs Espejo
Prueba
estads2ca
que
permite
establecer
si
las
medias
de
dos
grupos
varan
signica2vamente.
Los
grupos
que
se
comparan
corresponden
a
las
categoras
de
una
variable
cualita2va
(nominal
u
ordinal).
La
variable
que
se
contrasta
debe
ser
una
variable
cuan2ta2va.
Para
su
interpretacin
se
u2liza
el
nivel
de
signicacin.
Si
este
es
mayor
que
el
nivel
de
contraste
(0,05
o
0,01)
no
hay
diferencia
signica2va
entre
los
promedios
comparados.
Se
aplica
sobre
grupos
independientes:
grupo
1
y
grupo
2
corresponden
a
sujetos
dis2ntos
sin
una
relacin
que
los
vincule
Tambin
se
aplica
sobre
grupos
pareados:
grupo
1
y
grupo
2
corresponden
a
los
mismos
sujetos
en
momentos
dis2ntos
o
a
sujetos
vinculados.
Si
las
medias
son
diferentes
quiere
decir
que
hay
relacin
entre
la
variable
independiente
y
la
dependiente,
la
primera
inuye
sobre
los
resultados
de
la
segunda.
Requiere
de
la
aplicacin
de
una
prueba
de
diferencia
de
varianzas
(Fisher),
la
que
es
calculada
autom2camente
por
el
programa.
Esta
prueba
indica
si
las
varianzas
de
los
grupos
son
iguales
o
diferentes
(si
el
nivel
de
signicacin
es
menor
que
0,05
son
varianzas
diferentes.
Andrs Espejo
Andrs Espejo
Correlacin (R de pearson)
4 0
Prueba estads2ca para analizar la relacin entre dos variables cuyo nivel de medicin es escalar. No evala causalidad por ende ambas variables se consideran como independientes. Se interpreta el valor del coeciente el cual indica tanto la direccin como la intensidad de la relacin. El signo posi2vo indica que hay una relacin directa (mientras los valores de una variable aumentan los de la otra tambin aumenta y viceversa) y el nega2vo indirecta (mientras los valores de una variable aumentan los de la otra disminuyen). Los rangos de intensidad dependen del valor del coeciente: 1.00 relacin perfecta 0.50 relacin media 0.10 relacin dbil
Andrs Espejo
Correlacin (R de pearson)
4 1
El nivel de signicacin indica la probabilidad de error en la extrapolacin a la poblacin. Al elevar el r de pearson al cuadrado, lo que se ob2ene es la proporcin de varianza comn entre las dos variables (Varianza explicada) Ejemplo r= 0,8 r= 0,64 = 64% de varianza comn
Andrs Espejo
Correlacin (R de pearson)
4 2
Andrs Espejo
Se aplica para establecer si existen o no diferencias signica2vas en las puntuaciones de ms de dos grupos en forma conjunta. En otras palabras, lo que se pretende comprobar es si la variable independiente logra explicar las variaciones observadas en la variable dependiente La variable independiente es la que genera los grupos que sern comparados Ejemplo: Tramos de edad, Grupo Socioeconmico
ANOVA
El estads2co F se interpreta similar al estads2co T. Si el nivel de Sig. Es menor que 0,05, rechazamos la hipotesis de igualdad de medias y concluiremos que no todas las medias comparadas son iguales.
Puesto que el valor del nivel cr2co (,000), es menor que 0,05, decidimos rechazar la hiptesis de igualdad de medias y concluimos que las poblaciones denidas por la variable catlab no poseen el mismo salario medio.