You are on page 1of 19

Bioestadstica MH

Distribucin
Ji-Cuadrado

Wilber Rodrguez L

CARACTERSTICAS DE LA
DISTRIBUCIN CHI CUADRADO

Solamente toma valores


positivos.
Tiene asimtrica positiva.
A medida que aumentan los
grados de libertad, la curva es
menor elevada y mas extendida a
la derecha.

Como slo son los valores grandes de


los que nos llevan a
rechazar H0, la regin crtica es:
Figura: Regin crtica (sombreada) para un contraste con el estadstico

La Distribucin Chi Cuadrado se usa cuando se quiere


estudiar variables cualitativas (y tambin v.a. discretas o
continuas agrupadas en intervalo).

Tres usos de la esta distribucin Chi Cuadrado:


-Test de Ajuste de distribuciones:
Es un contraste de significacin para saber si los
datos de una muestra son conformes a una ley
de distribucin terica que sospechamos que es
la correcta.
-Test de homogeneidad de poblaciones:
Sirve para contrastar la igualdad de procedencia
de un conjunto de muestras de tipo cualitativo.
-Test de asociacin de variables:
Es un contraste para determinar la dependencia
o independencia de caracteres cualitativos

La prueba
en el contraste de
independencia de variables
aleatorias cualitativas
Para saber si dos variables cualitativas estn o no
asociadas, o si son independientes o no, se usa la
Distribucin Chi Cuadrado.
Los Oij son los valores observados que se obtienen de
la tabla de contingencia.
Los Eij son los valores esperados que se obtienen en
funcin de los valores observados.
Para obtener el valor experimental de la Chi Cuadrado se
utiliza la siguiente sumatoria:

2
i 1 j 1

ij

Eij
Eij

Tabla 1. Tabla de contingencia para estudiar la asociacin entre fumar


durante la gestacin y el bajo peso del nio al nacer. Valores observados
y valores esperados (entre parntesis) si los factores fuesen
independientes.

Recin nacido de bajo peso

Fumar durante la
Gestacin

No

Total

Si

43(18.5)

207(231.5)

250

No

105(129.5)

1645(1620.5)

1750

Total

148

1852

2000

1.- Planteamiento de hiptesis


H0: No hay asociacin entre fumar en la gestacin y
bajo peso del nio al nacer.
(El fumar en la gestacin es independiente al bajo
peso del nio al nacer)
H1:

Si hay asociacin entre fumar en la gestacin y


bajo peso del nio al nacer.
(El bajo peso del nio al nacer es dependiente del
fumar en la gestacin)

2.- Nivel de significancia: = 0.05


3.- Regla de decisin
Grados de Libertad =(Filas-1)x(Columnas-1)
= (2-1)X(2-1) = 1

3.84

4.- Estadstico de Prueba : Frecuencias marginales

E11

a b a c
n

E12

a b b d

E21

c d a c

E22

c d b d

148 250
E11
18,5
2000
E12

1852 250
231,5
2000

148 1750
E21
129,5
2000
E22

1852 1750
1620,5
2000

2
2
2
2

43 18,5

207 231,5

105 129,5

1645 1620,5

18,5

231,5

129,5

1620,5

40,04

5.- Comparacin del valor experimental con tabular

Como el Chi Cuadrado Experimental (40.04) es mayor que el


Chi Cuadrado Tabular(3.84), se rechaza Ho.

6.- Decisin
Si hay asociacin entre fumar en la gestacin y bajo
peso del nio al nacer , com un nivel de significancia de
0.05
o el bajo peso del nio al nacer es dependiente del
fumar en la gestacin, com un nivel de significancia de
0.05

Ejercicio 1
En un estudio se tiene la siguiente tabla de
contingencia:
Arterioesclerosis

hbitos de fumar

Si
No

Si
31
52

No
126
92

Total
157
144

Total

83

218

301

Probar la hiptesis de que la arterioesclerosis esta


asociado a los hbitos de fumar. Usar un nivel de
significancia de 0.05

Ejercicio 2
En un estudio se tiene la siguiente tabla de
contingencia:
Hacer deporte

Depresin

Si
No

Si
9
22

No
38
31

Total
47
53

Total

31

69

100

Probar la hiptesis de que no tener depresin esta


asociado a la realizacin de deporte. Usar un nivel de
significancia de 0.05

La prueba
en el contraste de
homogeneidad de poblaciones
Dos variables cualitativas para comparar sus
proporciones.Utilizaremos las tablas de
Contingencia
Para lo que utilizaremos el estadstico de prueba:
r

2
i 1 j 1

ij

E ij
E ij

Ejemplo
Se desea saber si la distribucin de los grupos sanguneos es
similar en individuos de dos poblaciones.
Frec
Observ

AB

Muestra 1

90

80

110

20

Muestra 2

200

180

240

30

Qu conclusiones pueden obtenerse de estos datos si se usa


un nivel de significacin del 5%
1.- Planteamiento de hiptesis

H0: La variable se distribuye igualmente en ambas


poblaciones
H1: La variable no se distribuye en forma homogenea em
ambas poblaciones
2.- Nivel de significancia: = 0.05

3.- Regla de decisin


Grados de Libertad = (Filas-1) x (Columnas-1)
= (2-1)(4-1)= 1x3= 3

7.81

4.- Estadstico de Prueba: Frecuencias Marginales

AB

TOTAL

M1

90

91.58

80

82.11

110

110.53

20

15.79

300

M2

200

198.42

180

177.9

240

239.47

30

34.21

650

290

290.00

260

260.00

350

350.00

50

50.00

950

2
i 1 j 1

ij

E ij
Eij

= 1.76

5.- Comparacin del valor experimental con tabular

entonces
hiptesis nula.

, luego no se puede rechazar la

6.- Decisin
Existe suficiente evidencia estadstica para no rechazar
que exista una distribucin homognea del grupo sanguneo
en ambas poblaciones.

Como el valor calor experimental es mayor que el valor


de tabla de 12.592, se rechaza H0, con un nivel de
significancia de 0.05. Es decir las cuatro poblaciones no
son homogneas con respecto al grado del uso de
droga.

GRACIAS

You might also like