You are on page 1of 20

Homogeneidad,

Independencia y Bondad de
Ajuste
8.1.Ejercicios Resueltos
EJERCICIO 1
Un gineclogo analiza la posible relacin entre la edad de la menarqua y
la aparicin de cncer de mama. Con el fin de estudiarlo clasifica a las
mujeres que acuden a su consulta en dos grupos, aquellas que tuvieron
la menarquia antes de los 12 aos (a las que distingue con el valor cero),
y aquellas que la tuvieron despus de esta edad ( a las que distingue
con el valor 1). Se presentan a continuacin los resultados obtenidos:

Edad
de
Menarqua
0
1

la

Cncer
de
S
64
47

Ma
ma
No
53
13
9

Determine si existe relacin o no entre estas variables.


SOLUCION
Para medir si existe relacin entre la edad de la menarquia y el cncer
de mama, realizamos un test de independencia.
: No existe independencia
Para tal hiptesis, ocupamos el estadstico 2.

En donde los observados son los valores que aparecen en la tabla y los
esperados los calculamos mediante H0, por ejemplo, el esperado para la
casilla

Luego para cada casilla, los esperados seran los que se muestran a
continuacin:

0
Edad
1

Si

Cncer
No

64

53

42,86

74,14

47
139
68,14 117,86

Tot
al
1
1
7
18
6

30
Total
111
192
3
Luego el estadstico nos queda de la siguiente manera:

= 10,425 + 6,027 + 6,558 + 3,791


= 26,801
Ahora, rechazamos
donde filas en este caso
tenemos 2 y columnas 2 y el lo escogemos como 0.05. Por lo tanto
tenemos
Cuadrado.

84 buscado en una tabla de la distribucin Chi-

Luego, como
84 se rechaza la hiptesis de que
ambas variables sean independientes con un 95% de confianza.
EJERCICIO 2
De un proceso de fabricacin, se seleccionan 100 ampolletas de 75 watts
y se lleva a cabo una prueba para determinar la vida til de estas
ampolletas. El resultado de esta prueba, en miles de horas, se resume
en la siguiente tabla:
Tiempo
de
Duracin
No de Ampolletas

00.2
29

0.2 0.4
20

0.4 0.6
15

0.6 0.8
9

0.8 1
12

11.1
15

Se puede concluir al nivel de significancia del 5%, que la vida util de


todas las ampolletas se distribuye exponencial?
SOLUCION
En este caso debemos hacer un test de Bondad de Ajuste, para una
distribucin exponencial de los datos.

Para esto debemos sacar las frecuencias esperadas para cada uno de los
rangos, bajo la hiptesis de una distribucin exponencial, luego primero
debemos estimar el parmetro de la exponencial.
Sabemos que la E(X) = 1 cuando X Exp(), luego ocupemos el
estimador de la media:

La media la calculamos as por tener los datos en una tabla de


frecuencias. Luego, obtenemos que:

Posteriormente, calculamos las probabilidades de estar en cada uno de


las clases de la tabla de frecuencias, para despus calcular la frecuencia
esperada.

Como tenemos un total de 100 observaciones, las frecuencias esperadas


las obtenemos multiplicando la probabilidad de estar en la clase por 100,
es decir:
fesperada[0 0,2] = P (0 < X < 0,2) 100
= 33,7 Luego haciendo el clculo para cada celda, queda:
Tiempo de
Duracin
No de Ampolletas
No
de
Amp.
Esperado

00.2
29
33.7

0.2 0.4
20
22.34

0.4 0.6
15
14.81

0.6 0.8
9
9.82

0.8 1
12
6.51

11.1
15
2.37

Finalmente para testear nuestra hiptesis


H0 : Los datos distribuyen Exponencial v/s H1 : No distribuyen exponencial
Ocupamos el estadstico

= 72,9
Luego rechazamos
48 con k el
nmero de clases y p el nmero de parmetros de la distribucin.
Por lo tanto, como 72,9 > 9,48 se rechaza la postura de una distribucin
exponencial en los datos del tiempo de vida de las ampolletas.
EJERCICIO 3
Un mecnico analiza la posible relacin entre la edad de la mquina y la
aparicin de una falla grave. Con el fin de estudiarlo clasifica a las
maquinas en dos grupos, aquellas que tuvieron una falla grave antes de
los 12 aos (a las que distingue con el valor 0), y aquellas que la
tuvieron despus de esta edad (a las que distingue con el valor 1). Se
presentan a continuacin los resultados obtenidos:
Falla
Grave

Edad
Maquina

Si
0 64

No
53

1 47

139

(a) Calcule el Test 2 de Pearson.


(b) Determine si existe relacin o no entre la variables
SOLUCION
Completamos la tabla dada con los valores esperados

Falla Grave
Si
No
0

64
42,8
61

Edad Maquina
1

Total

53

To
tal
1
1
7

74,13
9

47

139

68,1
39

117,8
61

111

192

1
8
6
3
0
3

(a) Dada la tabla completa con los valores esperados calculamos el


estadstico como sigue:

= 10,425 + 6,027 + 6,558 + 3,791


= 26,801

(b) Se rechaza H0 : independencia entre la edad de la mquina y si la


falla es grave si
2 > (1;(f1)(c1))
Como 2 = 26,801 > 3,841459 = 0,95;1
Se rechaza la hiptesis de independencia entre las fallas graves y la
edad de las maquinas.
EJERCICIO 4
Suponga que cierto artculo puede presentar hasta 4 defectos diferentes.
Una muestra aleatoria de 625 de estos artculos es clasificado de
acuerdo al nmero de defectos, obtenindose lo siguiente:
# de
defectos
# de
casos

8
2

18
5

18
2

11
0

6
6

Un ingeniero afirma que el nmero de defectos X es una variable


aleatoria con distribucin de probabilidad
!

e.o.c

Que podra concluir, en base a los datos de la muestra, con = 0,05,


respecto de lo firmado por el ingeniero?
SOLUCION
Necesitamos
calcular
probabilidades.

la

frecuencia

esperada,

mediante

luego el nmero de casos esperados ser


Ei = P(X = i) 625 = no de defectos igual a i

las

una vez calculados estos valores tenemos lo siguiente


# de defectos (i)
# de casos
observado (Oi)
# de casos
esperados (Ei)

0
82
89.2
5

1
185
178.
56

2
182
178.
56

3
11
0
11
9

4
6
6
59
.5

Para la hiptesis H0: los datos distribuyen con la funcin de


probabilidad dada. Se rechaza H0 si

donde k: no de clases y p: no de
parmetros. Luego

Por lo tanto no existe evidencia suficiente bajo un 95% de confianza para


rechazar H0, es decir, los datos pueden ser modelados por la distribucin
dada.
EJERCICIO 5
Una empresa empaca determinado producto de latas de tres tamaos
distintos, cada uno en distinta lnea de produccin. La mayor parte de las
latas se apegan a las especificaciones, pero un ingeniero de control de
calidad ha identificado los siguientes defectos:
Mancha en la lata.
Grieta en la lata.
Ubicacin incorrecta del anillo de apertura.
Falta del anillo de apertura.
Otras.
Se selecciona una muestra de unidades defectuosas de cada una de las
tres lneas, y cada unidad se clasifica segn el defecto, la siguiente tabla
de contingencia incluye esos datos:
Defecto
Manch

Griet

Ubicaci

Falt

Otra

Tamao

de

la

a
Lnea
de
Produccin

1
2
3
Total

a
34
23
32
89

65
52
28
145

a
17
25
16
58

21
19
14
54

s
13
6
10
29

muestra
150
125
100
375

Los datos sugieren desigualdad en las proporciones que caen en las


distintas categoras de las tres lneas?
SOLUCION
Los parmetros de inters son las diversas proporciones y las hiptesis
relevantes son:
H0: Las lneas de produccin son homogneas con respecto a las 5
categoras que no cumplen las especificaciones.
H1: Las lneas de produccin no son homogneas con respecto a las 5
categoras que no cumplen las especificaciones.
Ahora se presenta una tabla resumen con los valores esperados y el
valor de (Obs. Esp.)2/Esp.
C1
1

C2

C3

C4

C5 Total

34
65
17
21
13
35,60 58,00 23,20 21,60 11,60
0,072 0,845 1,657 0,017 0,169
23
52
25
19
6
29,67 48,33 19,33 18,00 9,67
1,498 0,278 1,661 0,056 1,391

32

28

16

14

10

23,73 38,67 15,47 14,40 7,73


2,879 2,943 0,018 0,011 0,664
Tota
l
89
145
58
54
luego, bajo un 95% de confianza

29

150

1
2
5
1
0
0
3
7
5

lo que indica que no existe suficiente evidencia para rechazar H 0, es


decir las lneas de produccin seran homogneas con respecto a las 5
categoras que no cumplen las especificaciones. Si disminuimos la
confianza a un 90% tenemos que

luego, ahora s existira evidencia bajo este nivel de significancia para


rechazar H0.
EJERCICIO 6
Un estudio de la relacin entre las condiciones de las instalaciones en
gasolineras y la agresividad en el precio de la gasolina reporta los
siguientes datos basados en una muestra de n = 144 gasolineras.

Anticua
da
Estnd
ar

Agresivid
ad
24

Modern
a
n.j

Neutr
al
15

No
agresiva
17

52

73

80

58

86

36

134

174

133

ni.
5
6
2
0
5
1
8
0
4
4
1

En el nivel 0.01, la informacin sugiere que las condiciones de


instalaciones y las polticas de precios son independientes entre si?
SOLUCION
La hiptesis a docimar es:
H0: Las condiciones de las instalaciones con la poltica de precios son
independientes. vs
H1: No existe independencia.
La siguiente tabla resume entrega la informacin necesaria para calcular
el estadstico 2.

C1
24
17,02
16,89
2,867
0,001
52
62,29
61,83

C2 C3 Total
15 17 5
22,10
6
2,278
73 80 2
80,88
0
5

1,700 0,769
5,343
3

Tot
al

58 86 36 1
54,69 71,02
8
54,29
0
0,200 3,159
6,159
4
4
134 174 133 1

luego, bajo un 99% de confianza

lo que indica que existe suficiente evidencia con este nivel de confianza
para rechazar H0, es decir el conocimiento de la poltica de precios de
una gasolinera proporciona informacin acerca de la condicin de las
instalaciones de la gasolinera.
EJERCICIO 7
Se obtuvo una muestra aleatoria de individuos que viajan solos en
automvil al trabajo, en una gran zona metropolitana, y cada individuo
fue clasificado de acuerdo con el tamao de su automvil y la distancia
de recorrido citadino. La siguiente informacin sugiere que dicha
distancia y el tamao del automvil estn relacionados en la poblacin a
la cual se hizo el muestreo? Exprese las hiptesis pertinentes y utilice
una prueba Chi-cuadrado con un nivel 0.05.
Distancia de Recorrido
Tamao de
Automvil

Subcompa
cto
Compacto
SOLUCION Mediano
Grande
La hiptesis a docimar es:

[0,1
0)
6
8
21
14

[10,2
0)
27

[20,...
)
19

36
45
18

17
33
6

H0: Existe independencia entre la distancia de recorrido y el tamao del


automvil.
vs
H1: No existe independencia.

La siguiente tabla resume entrega la informacin necesaria para calcular


el estadstico 2.
C1 C2 C3 Total
1
6 27 19 5
10,19 26,21
2
15,60
1,724 0,024
0,741
2
8 36 17 6
11,96 30,74
1
18,30
1,309 0,899
0,092
3
21 45 33 9
19,40 49,90
9
29,70
0,131 0,480
0,367
4
14 18
6 3
7,45 19,15
8
11,40 5,764
0,069 2,558
2
Tot
5
al
49 126 75 0
luego, bajo un 95% de confianza

lo que indica que existe suficiente evidencia con este nivel de confianza
para rechazar H0, es decir, la distancia de recorrido proporciona
informacin acerca el tamao del automvil.
EJERCICIO 8
Una empresa quiere contratar a cierta cantidad de personas y de los
postulantes que se presentan se hace una preseleccin de 24 hombres y
24 mujeres de entre los cuales el jefe de personal decide quien ser
contratado y quin no. Despus de que el jefe de personal hizo la
seleccin de los contratados los resultados fueron los siguientes,

Contratado
No
contratado

Hombr
e
21
3

Muj
er
14
10

Alguien acusa al empleador de tener un sesgo de seleccin a favor de los


hombres ya que 21 de 24 hombres fueron contratados y solo 14 de 24

mujeres tambin lo fueron. Existir discriminacin por parte del jefe de


personal?. Plantee las hiptesis con palabras y paramtricamente, llegue
a conclusiones utilizando un nivel de significancia de = 0,05.
SOLUCION
Hiptesis:
H0 : No existe discriminacin (Homogeneidad)
vs
H1 : Existe discriminacin (No Homogeneidad)
Equivalentemente
H0 : p1j = p2j j = 1,2

vs H1 : p1j 6=p2j para algn j

Para testear tales hiptesis, se ocupa el estadstico

donde

, el cual rechaza H0 cuando

Luego la tabla de valores esperados es:

Contratado
No
contratado
Total nj

Hombr
e
17,5

Total
ni
35

6,5

Muje
r
17,
5
6,5

24

24

48

13

Por lo tanto el estadstico de prueba queda

Como
, se rechaza H0, es decir, con un 95% de
confianza existe discriminacin hacia la mujer por parte del jefe de
personal.

EJERCICIO 9
De cada una de tres comunidades se sac una muestra de jvenes
casados. A cada pareja se le pidi que especificara la cantidad mnima
de educacin que esperaba que sus hijos recibieran. La siguiente tabla
muestra los resultados que se observaron en la muestra:

Nivel
Mnimo
Colegio
Educ.
comercial
Universitari
o
Total

Comunidad
A
B C
30
30
90

150

28 2
4
19 4
6
78 1
3
0
125 2
0
0

Tot
al
82
95
29
8
47
5

Que se puede concluir respecto a la homogeneidad de las aspiraciones


en la educacin de los hijos?
SOLUCION
Las hiptesis son:
H0 : Las 3 poblaciones son homogneas respecto de las aspiraciones de
educacin para sus hijos. (p11 = p12 = p13).
H1 : Las 3 poblaciones no son homogneas (Por lo menos 2 proporciones
de una misma fila no son iguales entre s.)
Para testear tales hiptesis, se ocupa el estadstico

donde

, el cual rechaza H0 cuando

Luego la tabla de valores esperados es:

Nivel
Mnimo
Colegio
Educ.
comercial
Universitari
o
Total

Comunidad
A
B
C
25.89 21.58 34.
53
30.00 25.00 40.
00
94.11 78.42 125
.5
150
125 20
0

Tot
al
82
95
29
8
47
5

Por lo tanto el estadstico de prueba queda

= 8,455

Como
, no existe evidencia en los datos para
rechazar H0, es decir, con un 95% de confianza existe homogeneidad
entre las comunidades.
EJERCICIO 10
Se seleccion una muestra al azar de 275 alumnos de ultimo ano de
colegio de cada uno de los siguientes tres grupos de rendimiento
atltico: alto, medio y bajo. Los muchachos se clasificaron de acuerdo
con la inteligencia tal como aparece en la tabla. Indican estos datos una
diferencia en la distribucin de la inteligencia entre los tres grupos?

Inteligen
cia
Alta
Media
Baja

Rendimiento
Alto Medio Bajo Tot
al
45
60
68
17
3
10
15
25
5
0
5
15
32
5
2

Total

60

90

12
5

10
0

SOLUCION
Las hiptesis son:
H0 : Los 3 niveles de inteligencia son homogneos respecto del
rendimiento. (p1j = p2j = p3j).
H1 : Los 3 niveles de inteligencia no son homogneos respecto del
rendimiento (Por lo menos
2 proporciones de una misma columna no son iguales entre si.)
Para testear tales hiptesis, se ocupa el estadstico

donde

, el cual rechaza H0 cuando

Luego la tabla de valores esperados es:

Inteligen
cia
Alta
Media
Baja
Total

Rendimiento
Alto
Medio Baj
o
37.77 56.62 78.
64
10.91 16.36 36.
36
11.35 17.02 23.
64
60
90
12
5

Por lo tanto el estadstico de prueba queda

= 10,199

Tot
al
17
3
50
52
10
0

Como
, se rechaza H0, es decir, con un 95% de
confianza no existe homogeneidad entre los niveles intelectuales.
EJERCICIO 11
Un investigador desea saber si es posible concluir que hay relacin entre
el grado de liberalismo y la posicin en la universidad en una poblacin
de estudiantes universitarios. Para estos efectos se seleccion una
muestra de 500 estudiantes. La tabla siguiente muestra la clasificacin
de los datos segn sus respuestas:

Clase
1er.
ao
2o.
ao
3er.
ao
4o.
ao
Total

Grado de
Liberalismo
Ligero Moderado Alto
30
19
16
10
75

Que se puede concluir respecto al

83

Tot
al
15
0
12
5
12
5
10
0
50
0

3
7
56
5
0
46
6
3
38
5
2
223
2
0
2
problema del investigador?

SOLUCION
Las hiptesis son:
H0 : Existe independencia entre el grado de liberalismo y el ao
universitario. (

H1 : No existe independencia entre el grado de

liberalismo y el ao universitario.(

Para testear tales hiptesis,

se ocupa el estadstico

donde

, el cual rechaza H0 cuando

Luego la tabla de valores esperados es:


Grado de Liberalismo

Clase

Ligero Moderado Alto

1er.
ao
2o.
ao
3er.
ao
4o.
ao
Total

22.50

66.90

18.75

55.75

18.75

55.75

15.00

44.60

75

223

60.
60
50.
50
50.
50
40.
40
20
2

Tot
al
15
0
12
5
12
5
10
0
50
0

Por lo tanto el estadstico de prueba queda

= 26,751

Como
, se rechaza H0, es decir, con un 95% de
confianza el grado de liberalismo en los estudiantes universitarios no es
independiente del ano que cursa el alumno.
EJERCICIO 12
Una muestra de 500 personas responde dos preguntas: filiacin poltica
y actitud hacia una reforma de impuestos, los resultados son los
siguientes:

Filiacin
Demcrat
a
Republica
no
Total

Actitud hacia Reforma


A favor IndiferenteEn contra
138
64
202

83

64

67

84

150

148

Tota
l
28
5
21
5
50
0

Existe relacin entre la tendencia poltica y la actitud hacia la reforma


de impuestos?. Plantee la hiptesis necesaria y concluya.
SOLUCION
Las hiptesis son:
H0 : Existe independencia entre la tendencia poltica y la actitud hacia la
reforma. (nij = ni n j
H1 : Existe asociacin entre la tendencia poltica y la actitud hacia la
reforma.(
Para testear tales hiptesis, se ocupa el estadstico

donde

, el cual rechaza H0

cuando

Luego la tabla de valores esperados es:

Filiacin
Demcrat
a
Republica
no
Total

Actitud hacia Reforma


A favor IndiferenteEn contra
115.14

85.5

84.36

86.86

64.5

63.64

202

150

148

Tota
l
28
5
21
5
50
0

Por lo tanto el estadstico de prueba queda

= 22,51

Como
, se rechaza H0, es decir, con un 95%
de confianza la tendencia poltica influye en la actitud hacia la
reforma.

EJERCICIO 13
En una muestra aleatoria de 100 universitarios se clasifico cada uno de
ellos segn si haba consumido alguna vez droga o no y el promedio de
notas. A partir de los datos tabulados en la tabla, proporcionan estos
datos evidencia suficiente como para concluir que hay una relacion entre
las dos variables? Use = 0,05.
Ha consumido
Drogas?
Promedio
Si
No
Tot
notas
al
4,0
10
29
3
9
> 4,0
20
41
6
1
Total
30
70
10
0
SOLUCION
Las hiptesis son:
H0 : Existe independencia entre el consumo de drogas y el promedio de
notas (
H1 : Existe asociacin entre el consumo de drogas y el promedio de
notas.(

donde

Para testear tales hiptesis, se ocupa el estadstico

, el cual rechaza H0 cuando

Luego la tabla de valores esperados es:

Promedio
notas
4,0

Ha consumido
Drogas?
Si
No
11,7

27,3

> 4,0

18,3

42,7

Total

30

70

Por lo tanto el estadstico de prueba queda

Tot
al
3
9
6
1
10
0

= 0,578

Como
, no se rechaza H0, es decir, con un 95% de
confianza el consumo de droga no influye en el promedio de notas de los
estudiantes.

You might also like