You are on page 1of 46

Pruebas

de signicacin estads2ca
Andrs Espejo

Inferencia Estads2ca
En las muestras los promedios de los grupos o porcentajes al interior de las tablas nunca sern iguales. Si extraemos una segunda muestra de la poblacin, obtendremos siempre resultados diferentes. Soluciones -Pruebas de signicacin (Pruebas de hiptesis) -Construccin de modelos predic2vos

Pruebas de signicacin estads2ca


Qu son? Son formas de evaluar diferencias de promedios, porcentajes o asociaciones entre variables en la poblacin, basndonos en los resultados de una muestra. Cmo operan? Evalan si la diferencia/asociacin observada es mayor a la que el azar podra generar. Qu 2pos de pruebas existen? No parametricas Parametricas (Normales)

Factores a considerar al momento de escoger una prueba estads2ca


Nmero y funcin de variables involucradas en el problema de anlisis: Entre cuantas variables queremos medir asociacin. No se trata de aplicar pruebas a todas las variables de forma antojadiza, hay que medir las posibles relaciones planteadas en los obje2vos, hiptesis y plan de anlisis de la inves2gacin. sSe debe denir cuales sern las variables independientes y dependientes, sin embargo hay que mencionar que las pruebas bivariadas no determinan causalidad, slo indican si las varibales estn o no signica2vamente asociadas. Tamao de la muestra Toda prueba estadis2ca bivariada requiere de un minimo de 30 casos para ser aplicada. En el caso de pruebas que se aplican sobre tablas de con2ngencia se requiere de un mnimo de 5 casos por celda.

Conceptos a considerar al momento de escoger una prueba estads2ca


Covariacin -Hace referencia a la variacin conjunta de las variables que estn siendo analizadas. - El sen2do de la covariacin puede ser posi2vo (coinciden) o nega2vo (opuesto) Inuencia - Hace referencia a una relacin entre variables - Una de ellas vara en funcin de los valores que toma la otra - No es sinnimo de covariacin, ya se reere a una posible relacin de causalidad.

Factores a considerar al momento de escoger una prueba estads2ca


Pruebas paramtricas -Variables escalares (intervalo razn) -Se conoce la distribucin de las variables (similar a la normal) -Poblaciones a comparar con distribuciones homogneas Pruebas no paramtricas: - Variables nominales u ordinales -No se conocen necesariamente los parmetros poblacionales

(Medidas de asociacin y correlacin)

TABLAS DE CONTINGENCIA

ANALISIS BIVARIADO CATEGORIAL: TABLAS DE CONTINGENCIA

Cuando se trabaja con variables categricas, los datos suelen organizarse en tablas de doble entrada en las que cada entrada representa un criterio de clasicacin (una variable categrica). Como resultado de esta clasicacin, las frecuencias (el nmero o porcentaje de casos) aparecen organizadas en casillas que con2enen informacin sobre la relacin existente entre amboscriterios. A estas tablas de frecuencias se les llama tablas de con2ngencia (CROSSTABS).

La nalidad de una tabla de con2ngencia es mostrar la relacin (o ausencia de la misma) entre dos variables

Aunque parece que hay una cierta relacin entre dos variables, Existe alguna razn para creer que las diferencias en la iden2cacin pol2ca y las diferencias de genero son ms que una variacin aleatoria?

Existen varias pruebas disponibles para determinar si la relacin entre dos variables de tablas de con2ngencia es signica2va.

Pruebas de Asociacin entre variables


Variables NO Paramtricas

Variables NOMINALES

Chi cuadrado

CHISQ proporciona el estads2co X2 o ji-cuadrado, propuesto por Pearson, que permite contrastar la hiptesis de que las variables de la y columna son independientes. El valor real del estads2co no es muy informa2vo. El valor de signicacin (sig. Asint2ca) con2ene la informacin que estamos buscando. Cuanto menor sea el valor de signicacin, menor habr de que las dos variables sean independientes (no estn relacionadas)

Prueba de Hiptesis

H 0 Asociacin = 0 H 1 Asociacin 0
Advertencias:
no hace dis2ncin de pruebas de una o dos colas. slo indica si las variables estn asociadas. no mide intensidad de la asociacin.

Clculo de la Prueba

( fo fe) = fe
2

(MrgFila * MrgCol) FE = n

Clculo de la Prueba

( fo fe) = fe
2

En SPSS
Si queremos que calcular alguna medida de asociacin para variables NOMINALES, presionar ESTADSTICOS en el men de la tabla de contingencia.
2 3

Andrs Espejo

En este caso, el valor de signicacin aparece ,000, (Tiene que ser menor que 0,05) lo que quiere decir que las dos variables estn relacionadas.

Desventajas del
No evala sen2do de la asociacin. No evala intensidad de asociacin. No acepta ms de 25% de casillas con frecuencias inferiores a 5.

La solucin esta en trabajar con otros estads2cos que estan basados o son correcciones del

tomar un valor entre 0 y 1, y para minimizar el efecto del tamao de la muestra sobre la cuan2cacin del grado de asociacin.

MEDIDAS BASADAS EN CHI CUADRADO Son medidas que intentan corregir l valor del estads2co X2 para hacerle e

/STATISTIC=CC: El Coeciente de con2ngencia toma valores entre 0 y 1, pero diicilmente llega a 1. Su valor mximo depende del nmero de las y de columnas. Un coeciente de 0 indica independencia, mientras que un coeciente que alcanza su valor mximo indica asociacin perfecta. /STATISTIC=PHI: Phi y V de Cramer. En tablas de con2ngencia 22, phi adopta valores entre 0 y 1, y su valor es idn2co al del coeciente de correlacin de Pearson. En tablas en las que una de las variables 2ene ms de dos niveles, phi puede tomar valores mayores que 1 (pues el valor de X2 puede ser mayor que el tamao muestral). La V de Cramer incluye una ligera modicacin de phi, y nunca excede de 1. En tablas de con2ngencia 22, los valores de la VCramer y phi son idn2cos.

MEDIDAS BASADAS EN CHI CUADRADO

Resumen de los coecientes

Variables ORDINALES

Con datos ordinales ya 2ene sen2do hablar de la direccin de la relacin: Una relacin posi2va indica que los valores altos de una variable se asocian con los valores altos de la otra, y los valores bajos, con valores bajos; una relacin nega2va indica que los valores altos de una variable se asocian con los valores bajos de la otra, y los valores bajos con valores altos.

/STATISTIC=GAMMA: Uno de los coecientes ms conocidos es el coeciente gamma de Goodman y Kruskal. As pues, gamma oscila entre -1 y 1. Si dos variables son estads2camente independientes, gamma vale cero; pero un gamma de cero no implica independencia (excepto en tablas de con2ngencia 22). /STATISTIC=D: d de Somers. Cuando una de las variables se considera independiente (X) y la otra dependiente (Y), Somers ha propuesto una modicacin del coeciente D. Que consiste en aadir en el denominador de gamma el nmero de pares empatados en la variable dependiente. /STATISTIC=BTAU: Tau-b de Kendall. Tanto el coeciente tau-b como el tau-c 2enen en cuenta el nmero de empates, pero de dis2nta manera. El coeciente tau-b toma valores entre -1 y +1 slo en tablas de con2ngencia cuadradas y si ninguna frecuencia marginal vale cero. /STATISTIC=CTAU: Tau-c de Kendall. Tau-c toma valores entre aproximadamente -1 y +1 sea cual sea el nmero de las y de columnas de la tabla.

Resumen

Correlacin
El coeciente de correlacin de Spearman es una medida de asociacin lineal, para variables ordinales. Establece la magnitud y la direccin de la relacin El coecientes de correlacin de Pearson es una medida de asociacin lineal especialmente apropiada para estudiar la relacin entre variables de intervalo o razn. Ambos coecientes poseen escasa u2lidad para estudiar las pautas de relacin presentes en una tabla de con2ngencia ppica, pues lo habitual es u2lizar las tablas de con2ngencia para cruzar variables de 2po nominal o, a lo sumo, de 2po ordinal con slo unos pocos niveles. Se interpreta el valor del coeciente 1= relacin lineal mxima, directa y -1=relacin lineal mxima, indirecta

Variables ORDINALES

Prueba de asociacin y correlacin para variables ESCALARES


3 7

Andrs Espejo

Diferencia de Medias (T de student)


3 8

Prueba estads2ca que permite establecer si las medias de dos grupos varan signica2vamente. Los grupos que se comparan corresponden a las categoras de una variable cualita2va (nominal u ordinal). La variable que se contrasta debe ser una variable cuan2ta2va. Para su interpretacin se u2liza el nivel de signicacin. Si este es mayor que el nivel de contraste (0,05 o 0,01) no hay diferencia signica2va entre los promedios comparados. Se aplica sobre grupos independientes: grupo 1 y grupo 2 corresponden a sujetos dis2ntos sin una relacin que los vincule Tambin se aplica sobre grupos pareados: grupo 1 y grupo 2 corresponden a los mismos sujetos en momentos dis2ntos o a sujetos vinculados. Si las medias son diferentes quiere decir que hay relacin entre la variable independiente y la dependiente, la primera inuye sobre los resultados de la segunda. Requiere de la aplicacin de una prueba de diferencia de varianzas (Fisher), la que es calculada autom2camente por el programa. Esta prueba indica si las varianzas de los grupos son iguales o diferentes (si el nivel de signicacin es menor que 0,05 son varianzas diferentes.
Andrs Espejo

Diferencia de Medias (T de student)


3 9

Andrs Espejo

Correlacin (R de pearson)
4 0

Prueba estads2ca para analizar la relacin entre dos variables cuyo nivel de medicin es escalar. No evala causalidad por ende ambas variables se consideran como independientes. Se interpreta el valor del coeciente el cual indica tanto la direccin como la intensidad de la relacin. El signo posi2vo indica que hay una relacin directa (mientras los valores de una variable aumentan los de la otra tambin aumenta y viceversa) y el nega2vo indirecta (mientras los valores de una variable aumentan los de la otra disminuyen). Los rangos de intensidad dependen del valor del coeciente: 1.00 relacin perfecta 0.50 relacin media 0.10 relacin dbil

Andrs Espejo

Correlacin (R de pearson)
4 1

El nivel de signicacin indica la probabilidad de error en la extrapolacin a la poblacin. Al elevar el r de pearson al cuadrado, lo que se ob2ene es la proporcin de varianza comn entre las dos variables (Varianza explicada) Ejemplo r= 0,8 r= 0,64 = 64% de varianza comn

Andrs Espejo

Correlacin (R de pearson)
4 2

Andrs Espejo

ANALISIS DE LA VARIANZA (ANOVA)

Se aplica para establecer si existen o no diferencias signica2vas en las puntuaciones de ms de dos grupos en forma conjunta. En otras palabras, lo que se pretende comprobar es si la variable independiente logra explicar las variaciones observadas en la variable dependiente La variable independiente es la que genera los grupos que sern comparados Ejemplo: Tramos de edad, Grupo Socioeconmico

ANOVA

El estads2co F se interpreta similar al estads2co T. Si el nivel de Sig. Es menor que 0,05, rechazamos la hipotesis de igualdad de medias y concluiremos que no todas las medias comparadas son iguales.

Puesto que el valor del nivel cr2co (,000), es menor que 0,05, decidimos rechazar la hiptesis de igualdad de medias y concluimos que las poblaciones denidas por la variable catlab no poseen el mismo salario medio.

You might also like