Professional Documents
Culture Documents
Pruebas de hiptesis
medias, varianzas, proporciones
Introduccin
Con mucha frecuencia el propsito de la investigacin va ms all
de describir el comportamiento de la variable en la muestra y debemos de generalizar o inferir los resultados obtenidos en la muestra a la poblacin o universo.
Los datos casi siempre son recolectados de una muestra y sus
medidas importantes tales como la media muestral y la varianza
muestral reciben el nombre de estadsticas. Por otro lado, las medidas representativas de la poblacin, media poblacional y varianza poblacional, casi siempre desconocidos, reciben el nombre de
parmetros. Un esquema puede ser el siguiente:
X: variable estudiada
RECOLECCION DE
DATOS EN LA
MUESTRA
PARAMETROS
ESTADISTICAS
[107]
105
El razonamiento de pruebas de hiptesis se emplea para responder preguntas como las siguientes:
1.
2.
3.
106
107
108
La hiptesis nula
no es verdadera
Rechazar la
hiptesis nula
error de tipo I
P(I) =
Correcta
No rechazar la
hiptesis nula
Correcta
Decisin
error de tipo II
P(II) =
109
denota con .
= P (Re chazar
H /H
= P( Aceptar
H /H
o
es verdadera) = P(I)
o
es falsa) = P(II).
P( I ) = P(Re chazar
H /H
o
verdadero) = .
(3.1)
Cuando no sea posible rechazar la hiptesis nula, ser preferible indicar que "no existe suficiente informacin como para rechazar la hiptesis nula".
Regla de Decisin
As como en el juicio se debe de tomar una decisin acerca del
acusado: declararlo culpable o inocente, tambin en estadstica
inferencial debe tomarse una decisin acerca de la hiptesis nula:
rechazarla o no rechazarla.
Si se rechaza la hiptesis nula, es porque se encuentran (en la
muestra) resultados significativamente diferentes a lo que debera ocurrir si la hiptesis nula fuera cierta. El no rechazar la hiptesis nula, quiere decir que los resultados no fueron significativamente diferentes de lo que se esperaba, bajo la suposicin de que
la hiptesis nula era cierta.
En todo caso, siempre se debe establecer previamente un criterio para decidir acerca de la hiptesis nula, es decir, qu valores
de la estadstica de prueba (que se describir en el siguiente paso)
delimitan el rechazo de la hiptesis nula. En estadstica, ste pro-
110
<
>
111
dra rechazar la hiptesis nula. El problema es determinar el rango de valores de x para los que, stos puedan considerarse grandes.
En general, el conjunto de valores de la estadstica de prueba
para los cuales se rechaza la hiptesis nula, se llama regin de
rechazo o regin crtica.
Por ejemplo, se podra tomarse como una regin de rechazo
el intervalo (16, ), de tal manera que si la media muestral encontrada cae en este intervalo, se debe rechazar la hiptesis nula. Esta
decisin es razonable puesto que si la hiptesis nula es verdadera,
la probabilidad de encontrar una media muestral mayor que 16,
en el supuesto de normalidad, es:
16 14
X u
P X > 16 / u = 14 = P Z >
P Z >
= 1 P (Z 6.32 ) =0.000.
40
n
X
14.2 14
P X > 14.2 / = 14 = P Z >
P
Z
>
= 1 P (Z 0.63)
2
40
n
=1- 0.7357=0.2643.
En este caso se observa que existe la posibilidad (aunque pequea) de encontrar un valor de la media muestral en el intervalo
(14.2, ), an cuando la hiptesis nula sea verdadera. Esto implica que podramos equivocarnos al rechazar esta hiptesis cuando
la media muestral cae en este intervalo.
En el ejemplo analizado, lo que se debe es elegir una regin
de rechazo como el intervalo (a, ) adecuada, de tal manera que si
la media muestral cae en este intervalo se rechace la hiptesis nula.
El valor de la constante, a, se elige de tal manera que la probabili-
112
dad de equivocarnos al rechazar la hiptesis nula, siendo sta verdadera, sea un valor pequeo, es decir, sea la probabilidad de
cometer el error tipo I o el denominado nivel de significacin. As
se estara tratando de evitar, en lo posible, el error de una decisin
equivocada.
Por ejemplo, si deseamos cometer el error de tipo I con probabilidad igual a = 0.05, se puede escoger como regin de rechazo, al intervalo (a, ), de manera que:
H /H
o
es verdadera)
a u
a 14
6.32(a 14)
>
P
Z
=0.05
= 1 P Z
2
2
40
n
= P (X > a / u = 14 ) = P Z >
6.32(a 14)
P Z
= 0.95 . Usando la tabla normal se observa que:
2
6.32(a 14)
= 1.645
2
a 14 = 0.52 a = 14.52
x 14
> 1.645 . Luego, en lugar del valor de la media muestral se
2
40
puede considerar el valor de la media muestral estandarizada,
x 14
2
, como la estadstica de prueba y como regin de rechazo
40
de la hiptesis nula, al intervalo (1.645, ).
La decisin puede expresarse de la siguiente manera: rechazar la hiptesis nula si el valor estandarizado de la media mues113
tral, zc =
x 14
, cae en el intervalo (1.645, ).
2
40
Regin de rechazo
1.645
114
Asociados a los parmetros existen estimadores de los parmetros que se han presentado en el captulo anterior y que se resumen a continuacin:
Es necesario recordar que cuando se observa la muestra, el estimador de un parmetro, es una funcin de variables aleatorias y
Parmetro
Notacin
Nombre
media poblacional
media muestral
varianza muestral
diferencia de
medias muestrales
x x
diferencia de medias
poblacionales
X X
cociente de varianzas
poblacionales
S /S
diferencia de
proporciones
poblacionales
P P
Notacin
Nombre
Estimaciones
con los valores
de la muestra
varianza poblacional
Estimadores
cociente de
varianzas
muestrales
diferencia de
proporciones
muestrales
s /s
pp
1
1 n
X i y si los valores observados de la muesn i =1
tra son x1 = 25, x2 = 30, x3 = 40, x4 = 20, x5 = 35 , el valor ob1 n
150
servado de la media muestral es, x = xi =
= 30 y se de5
n i =1
, es la funcin X =
115
H 0 : Parmetro = w
zona de no rechazo
de la hiptesis nula
zona de rechazo
De la hiptesis
Zona de rechazo
de la hiptesis nula
: Parmetro w
zona de no rechazo
de la hiptesis nula
Zona de rechazo
de la hiptesis nula
: Parmetro w
zona de no rechazo
de la hiptesis nula
w
donde " w" es un valor conocido.
116
zona de rechazo
de la hiptesis nula
H
H
H
: parmetro w
: parmetro < w
: parmetro > w
117
118
1.645
b)
d e
rechazar la hiptesis nula siendo verdadera es = 0.05; se plantea que P (Z < z ) = 0.05 y en la tabla normal estndar se encuentra zterico = 1.645. Es decir, P (Z < 1.645) = 0.05 , por lo
que la regin crtica es el intervalo (- , -1.645 ).
c)
u w y la probabili-
-1.645
Paso 6. Decisin
de rea 0.025
-1.645
-1.645
0.025 de rea
119
120
H a : : > 13
Como la hiptesis alternativa es de la forma ">", la prueba de
hiptesis que se est planteando es unilateral o de una cola hacia
el lado derecho y la regin crtica ser de la forma(a, ).
Paso 2 Seleccin de la herramienta de anlisis, del modelo y
obtencin de la regin crtica
La herramienta de anlisis que se utilizar es la media muestral y
su valor es x =14 puntos.
Hemos visto en el captulo 1 que el comportamiento de la
media muestral X se puede modelar de una manera aproximada
con la distribucin normal. Puesto que la varianza de toda la poblacin se supone conocida, usaremos el hecho que:
Z=
121
nula.
En la tabla normal, el valor de z que cumple P (Z > z ) = 0.05 =
, es z = zterico = 1.645.
Luego, la regin crtica o de rechazo de la hiptesis nula es el
intervalo (1.645, ).
Regin de rechazo de H0
Paso 3. Tomar la
1.645
muestra y obtener
zc
zc =
x 0 14 13
=
= 10, es el valor muestral estandariz ado.
1
100
n
Paso 4. Decidir
Se puede ver que el valor muestral estandarizado o el valor de la
estadstica de prueba, zc = 10 , se ubica en la regin de rechazo de
la hiptesis nula, es decir pertenece al intervalo (1.645, ), por lo
que la decisin es rechazar la hiptesis nula.
Con un nivel de significacin = 0.05, existe evidencia para
afirmar que es posible que la percepcin del Director Acadmico
sea cierta.
Observacin 1
Es importante sealar que los softwares estadsticos como el SPSS,
reportan el nivel crtico de la prueba o p-value, en lugar de indi-
122
n
este resultado para ilustrar el procedimiento para contrastar hiptesis, cuando la hiptesis alternativa tiene el sentido ">". Los
123
H
H
: = 0
: > 0
Paso 2: Se toma una muestra aleatoria de tamao n y se obtiene el valor de la media muestral. Luego, se obtienen el valor
de la estadstica de prueba zc =
x u0
, que corresponde a una
124
Hiptesis
Estadstico de prueba
Regla de decisin
Rechazar la hiptesis,
H
H
: = 0
: > 0
1
zc =
x 0
: u = u0 si
p _ value <
H
H
: = 0
: < 0
zc =
x 0
p _ value <
: = 0
zc =
x 0
zc > zterico
equivalentemente
Usted es un inspector de escuelas pblicas y realiza un experimento para investigar si la habilidad de lectura de estudiantes de
quinto ao de primaria. En una muestra aleatoria de 100 estudiantes de esta poblacin encuentra una habilidad media de lectura
igual a 70 palabras por minuto. Las notas nacionales sobre la habilidad de lectura, para los estudiantes del quinto ao de primaria, muestran una distribucin normal con media 75 palabras por
minuto y una desviacin estndar igual a 12. Todo puntaje por
debajo de 75 se considera deficiente. Es razonable considerar que
la habilidad de lectura de los estudiantes de quinto de primaria es
deficiente?. Use = 0.05.
Solucin
125
u < 75
zc
zc =
x 70 75
=
= 5.10.
12
150
n
126
-1.645
Paso 4: Decisin
El valor muestral estandarizado, zc = -5.1 encontrado en el paso
2, es menor que el valor terico zterico = -1.645; es decir, se cumple
zc = 5.10 < zterico = 1.645 , por lo que la decisin es rechazar la
hiptesis nula. Con un nivel de significacin = 0.05, es posible
que la habilidad de lectura de estudiantes de quinto ao de primaria sea deficiente.
Nivel crtico de una prueba( p _ value )
La manera cmo se encontr la regin de rechazo dependi del
valor del nivel de significacin escogido de antemano. El valor
proporciona una medida de la significacin de la inferencia realizada; sin embargo ste no indica hasta qu grado la prueba es
significativa. As para las hiptesis:
Ho: u = 75
Ha: u < 75,
los valores estandarizados de la media muestral z = -5.10
y por ejemplo z = -2.5 son significativos al nivel de significacin
= 0.05. Ambos valores caen en la regin de rechazo de la prueba (, -1.645)
El valor de la media muestral estandarizada z= -5.10, presen-
127
128
zc =
x 0
se usa la estadstica de
n
x 0
s
. Se ha visto en el captulo 1 que la variable aleaprueba
n
X
t=
S
toria
tiene distribucin t-Student con ( n 1 ) grados de
n
tc=
libertad.
Se usar este resultado para ilustrar el procedimiento para
contrastar hiptesis, cuando la hiptesis alternativa tiene el sentido ">". Los pasos se resumen a continuacin:
Paso 1: Se plantean las dos hiptesis, nula y alternativa:
H : =
H 1 : > 0
0
x 0
.
s
n
Paso 3: Se encuentra la regin crtica, para el nivel de significacin P(t( n 1) > tterico ) = , donde tterico es el valor de la abcisa de la
distribucin t-Student con (n-1) grados de libertad, que deja de
rea al lado derecho de la curva.
La regin crtica es el intervalo ( tterico , ).
Paso 4: Se decide rechazar la hiptesis nula frente a la hiptesis
alternativa si el valor de la estadstica de prueba tc cae en la regin ( tterico , ).
De la misma manera es posible indicar las reglas para los casos donde la hiptesis alternativa es: H 1 : < 0 o H 1 : 0 . En
129
Estadstica de prueba
Regla de decisin
Rechazar la hiptesis
H
H
: = 0
: > 0
1
0
H
H
H
H
: = 0
: 0
1
: = 0
: < 0
tc =
tc =
tc =
x 0
s
n
x 0
s
n
x 0
s
n
: u = u0 , si
tc > tterico
p _ value <
tc < tterico
p _ value <
tc > tterico
equivalentemente
tc > tterico
tc < tterico
p _ value < / 2
El Director Acadmico del centro pre universitario de la UFV tiene la percepcin de que el rendimiento acadmico durante el primer ao de estudios en la universidad, de los alumnos ingresantes a travs de la institucin que dirige mejora ao a ao. Sabe que
histricamente los alumnos han tenido un rendimiento promedio
de 13 puntos. Para confirmar su percepcin llev a cabo un estudio, para el que escogi una muestra aleatoria de 20 alumnos que
130
H 0 : u = 13
Hiptesis alternativa: Se tiene la sospecha que el rendimiento promedio ha mejorado. Es decir, la hiptesis alternativa es:
H 1 : u > 13
Paso 2: Se toma la muestra y calcula
tc
Bajo el supuesto de que la hiptesis nula es verdadera, la estadstica de prueba toma el valor 4.47, es decir:
tc =
x 0 14.5 13
=
= 4.47.
s
1.5
n
20
131
Para el nivel de significacin = 0.05 y prueba unilateral del sentido mayor, se cumple que P t(19 ) > tterico = 0.05 . En la tabla t-Student, el valor de tterico con 19 es: tterico = 1.729. Luego, la regin
crtica es el intervalo (1.729, ).
Paso 4: Decisin
Se puede ver que el valor de tc = 4.47 cae en la regin de rechazo
de la hiptesis nula. Es decir: tc = 4.47 > tterico = 1.729 , por lo que la
decisin es rechazar la hiptesis nula. Con un nivel de significacin = 0.05, es posible que la percepcin del Director Acadmico
sea cierta.
Ejemplo 3.5
Un estudiante de maestra investiga un mtodo que supuestamente
modifica la edad en la cual los nios comienzan a hablar, edad
que histricamente es 11 meses. Aplic su mtodo y luego ha hecho el seguimiento a 19 nios y ha registrado las siguientes edades (en meses) en la que dichos nios pronunciaron las primeras
palabras.
10 10 11 16 17 16 14 12 12 13 9 10 12 12 10 17 13 15 18
Al estudiante de maestra le preocupa: a) Identificar el problema. b) Plantear la hiptesis nula y la hiptesis alternativa. c)
Para un nivel de significacin 0.05, quiere saber si funcion o no el
mtodo que aplic.
Solucin
Primero se realizan los clculos auxiliares para obtener los valores de las estadsticas descriptivas media muestral x y desviacin
estndar muestral, s; para luego calcular el valor de la estadstica
de prueba, tc . Los estudiantes que necesitan mayores detalles re-
132
xi
Nmero
de nios f i
xi f i
1
4
1
4
2
1
1
2
2
1
19
9
40
11
48
26
14
15
32
34
18
247
9
10
11
12
13
14
15
16
17
18
x=
1 k
= 13 ,
fi = 247
n i =1 xi
19
1 k
n 1 i =1
(x x)
(x x) (x x)
2
16
9
4
1
0
1
4
9
16
25
fi
16
36
4
4
0
1
4
18
32
25
140
n = 19 es el tamao de muestra.
f i = 140 = 7.777
18
S = 2.7888
H 0 : = 11
Hiptesis alternativa: La sospecha del estudiante de maestra y
la informacin en la muestra nos dice que ese promedio ha sido
133
H 1 : > 11
Como la hiptesis alternativa es de la forma ">", la prueba de
hiptesis que se est planteando es unilateral o de una cola hacia
el lado derecho.
Paso 2: Con la informacin de la muestra y bajo el supuesto de
que la hiptesis nula es verdadera, la estadstica de prueba toma
el valor 3.126, porque:
tc =
x 0
13 11
=
= 3.126
s
2.7888
n
19
134
Activar el SPSS.
Crear el archivo DATOS1- nios y declarar la variable EDAD
con los valores que ha tomado dicha variable en el ejemplo anterior. Luego se ejecutarn los siguientes comandos del SPSS
que permitirn encontrar el valor de tc que luego se comparar con el valor de tterico encontrado en la tabla t-Student.
ANALIZE/COMPARE MEANS/ ONE-SAMPLE T-TEST/
llevar a TEST VARIABLE la variable creada EDAD/ en TEST
VALUE colocar 11 (el valor de la media poblacional bajo la
hiptesis nula)/ pulsar el comando OK.
En el output del SPSS se lee el valor de tc = 3.126 .
Paso 3: Es igual a la solucin del problema 3.5.
One-Sample Test
Test Value = 11
T
edad
3.126
135
Z=
t =
X
S
n
136
Solucin
Paso 1: La hiptesis nula indica que no existe diferencia en el rendimiento promedio, mientras que la hiptesis alternativa dice que
aplicando el Plan Huascarn el rendimiento promedio ha disminuido. As:
H 0 : = 12 versus H1 : < 12 .
Paso 2: La muestra usada es suficientemente grande, por lo que la
media muestral tiene distribucin aproximadamente normal y el
valor de la estadstica de prueba es -1.75, porque:
zc =
x 0 11.5 12
=
= 1.75
s
2.8
n
96
Paso 3: Para = 0.05, P (Z < zterico ) = 0.05 = , por lo que zterico = 1.645. Luego, la regin de rechazo es el intervalo (- , -1.645).
Paso 4: Como el valor del estadstico de prueba zc = -1.75 cae en
el intervalo indicado se rechaza la hiptesis nula; existe evidencia
de que el rendimiento acadmico de los estudiantes ha disminuido.
Para la proporcin de una poblacin grande
En algunas situaciones el parmetro sobre el que se trata de evaluar la hiptesis es la proporcin de elementos con cierta caracterstica A () en una poblacin. Por ejemplo, la proporcin de estudiantes que desaprueban el curso de matemticas, la proporcin
de estudiantes motivados, la proporcin de padres de familia que
asisten a la convocatoria realizada por el director del colegio.
Especficamente se trata de probar la hiptesis:
H0 : = 0
frente a una de las siguientes hiptesis alternativas:
137
H1 : < 0
H1 : > 0
H1 : 0
P 0
tiene distribucin aproximadamente
0 (1 0 )
n
N(0,1). A continuacin se presenta el resumen de las hiptesis contrastadas, la estadstica de prueba y la regla de decisin.
donde P es el estimador del parmetro , y p es el valor que
toma la variable aleatortia P cuando se observa la muestra.
Ejemplo 3.8
Hiptesis
Estadstico de prueba
Regla de decisin
Rechazar la hiptesis
: = , si
H
H
: = 0
: > 0
0
zc =
p 0
0 (1 0 )
zc > zterico
n
con el SPSS:
p _ value <
H
H
: = 0
: < 0
0
0
zc =
p 0
0 (1 0 )
zc < zterico
n
Con el SPSS:
p _ value <
H : =
H :
0
0
0
zc =
p 0
0 (1 0 )
zc > zterico
equivalentemente
p _ value < / 2
Hace tres aos el Ministro de Educacin afirm que histricamente el 30% de alumnos que estudian en zonas rurales abandonan
sus estudios al culminar el tercer ao de primaria. En los ltimos
138
H 0 : = 0.30 versus
zc =
p 0
0 (1 0 )
0.2 0.3
= 4.88
0.3(0.7)
500
Paso 3: Para =0.05, P (Z < zterico ) = 0.05 =, por lo que= zterico -1.645.
Luego, la regin de rechazo es el intervalo (- , -1.645).
Paso 4: Como el valor del estadstico de prueba
zc =-4.88 cae en el
139
140
2
nes N 1 , 1 y N 2 , 22 respectivamente; entonces, las medias
n2 ,
n1
2
1
y
tienen las siguientes distribuciones N 1 ,
n1
2
N 2 , 2 . Luego, la variable aleatoria X 1 - X 2 estandarizada,
n2
n1
n2
zc =
(x x )
1
2
+ 2 , donde x1 y x2 son los valores que toman
n1 n2
2
1
lo (1.96, ).
Paso 4: Si el valor del estadstico de prueba cae en uno de los intervalos de la regin de rechazo, entonces, se rechaza la hiptesis
nula.
A continuacin se presenta el resumen de las hiptesis contrastadas, la estadstica de prueba y la regla de decisin.
Ejemplo 3.9
En un sistema educativo se aplicaron dos mtodos A y B para ensear el curso de fsica. En un grupo de 80 estudiantes se aplic el
Hiptesis
Estadstica de prueba
Regla de decisin
Rechazar la hiptesis
H 0 : 1 = 2 , si
H 0 : 1 = 2
H1 : 1 > 2
H 0 : 1 = 2
H 1 : 1 < 2
zc =
zc =
(x x )
1
+
n1 n2
2
1
(x x )
1
zc > zterico
2
2
+
n1 n2
2
1
2
2
con el SPSS:
p _ value <
zc > zterico
con el SPSS:
p _ value <
H 0 : 1 = 2
H 1 : 1 2
zc =
(x x )
1
+
n1 n2
2
1
2
2
zc > zterico
equivalentemente
p _ value < / 2
142
H 0 : 1 = 2
H1 : 1 2
zc =
(x x )
1
+
n1 n2
2
1
2
2
(13 13.5)
3 3.5
+
80 120
= -1.94.
143
Z=
(X
X1
X 2 (1 2 ) , tiene distribucin
2
+
n1 n2
2
X 2 estandarizada
N (0,1) .
( X 1 X 2 ) (1 2 )
1
1
S +
n1 n2
2
p
za poblacional es S p2 =
(n 1)S + (n 1)S
n +n 2
2
1
2
2
la estadstica de prueba tc =
( x1 x2 )
1
1
s 2p +
n1 n2
. s 2p =
(x x )
1
2 2
+
n1 n2
, se usa
(n 1)s + (n 1)s
n +n 2
2
1
2
2
es
la varianza combinada de las dos muestras, s12 y s22 son las estimaciones de las varianzas muestrales de tamaos n1 y n2 .
A continuacin se presenta el resumen de las hiptesis con144
Estadstica de prueba
Regla de decisin
Rechazar la hiptesis
: u1 = u2 , si
0
H
H
H
H
H
H
: 1 = 2
: 1 > 2
1
0
: 1 = 2
: 1 < 2
1
1
1
s 2p +
n1 n2
: 1 = 2
: 1 2
1
0
con el SPSS:
p _ value <
( x1 x2 )
tc =
tc > tterico
( x1 x2 )
tc =
tc < tterico
1
1
s 2p +
n1 n2
con el SPSS:
p _ value <
tc > tterico
( x1 x2 )
tc =
1
1
s 2p +
n1 n2
equivalentemente
p _ value <
H
Para H
Para H
Para
tterico = t(
1
1
(n n
: < , P(t(n n
: 1 > 2 , P t(
1
)
)= donde t
=t
t
) > tterico = donde terico ( n1+n2 2,1 )
) < tterico
terico
= t(
n1+n22,1 )
n1+n2 2,1 / 2 )
tterico = t(
n1+n22,1 / 2 ) .
145
15
16
15
13
13
16
16
Mtodo B
13
14
14
11
12
14
13
14
17
H 0 : 1 = 2
H1 : 1 2
Paso 2 Se explica con detalle la obtencin de las media y varianzas de las muestras:
Suponiendo que las varianzas poblaciones son iguales se estima con:
146
s 2p =
(n 1)s + (n 1)s
n +n 2
2
1
2
2
(x
Notas de los
estudiantes
mtodo A
1i x1
8(2) + 6(1.333)
= 1.7141
14
Notas de los
estudiantes
mtodo B
x1i
0
1
0
4
4
1
1
1
4
16
x1 =
1 n1
135
= 15
x
1i =
n1 i =1
9
s12 =
1 n1
n1 1 i =1
s22 =
(x
1i x1
13
14
14
11
12
14
13
---91
tc =
0
1
1
4
1
1
0
8
n1 = 9
16
=2
8
1 n2
91
= 13
n21 i =1 x2i = 7
1 n2
n2 1 i =1
2i x2
x2 i
15
16
15
13
13
16
16
14
17
135
x2 =
(x
(x
2i x 2
( x1 x2 )
1
1
s 2p +
n1 n2
n2 = 7
8
= 1.333
7
15 13
1 1
1.7141 +
9 7
= 3.031.
Paso 3: Para = 0.10 P t(n +n 2 ) > tterico = , con 14 grados de libertad, tterico = t( n1+n 2 2,1 / 2 ) = t(14,0.975) = 1.761 tterico = t( n +n 2,1 / 2) = t(14,0.975) = -1.761.
Luego, la regin de rechazo es el intervalo (- , -1.761) el
intervalo (1.761, ).
1
147
-1.76
1.76
H 0 : 1 = 2
H1 : 1 2
148
Activar el SPSS.
Abrir el archivo de DATOS2-mtodos. Podr observar que
tenemos valores de dos variables: de la variable rendimiento
de los estudiantes y de la variable grupo, donde se clasifica a
los estudiantes segn el mtodo de enseanza. En la variable
grupo, se ha codificado con 1 a quienes recibieron la ense-
c)
= 0.05 , pues si
rendimiento
Equal variances
assumed
df
Sig. (2-tailed) =
3.031
14
.009
p _ value
que la diferencia encontrada entre las medias muestrales es significativa al nivel de significacin 0.10.
Poblaciones independientes: igualdad de medias cuando las varianzas
poblacionales son desconocidas y diferentes
Si X 1 e X 2 son variables aleatorias independientes con distribu-
149
dias muestrales
2
o n1 y n2 , tienen las siguientes distribuciones N 1 , 1 y
n1
N 2 , 2
n2
n1
2
se estiman con s1 = n 1 x1i x1
i =1
1
)y
2
s22 =
( x1 x2 )
s12 s22
+
n1 n2
1 n2
n2 1 i =1
(x
2i x 2
) y la
2
s12 s22
n1 + n2
s12
s22
n
n
2
1
+
n1 + 1
n2 + 1
2.
Si k 30 , el estadstico tc tiene distribucin aproximadamente normal y el procedimiento es similar al caso donde se conocen
las varianzas.
Si las muestras son suficientemente grande ( n1 30 y
n2 30 ) e independientes, para probar la hiptesis respecto a la
igualdad de medias, se usa como valor de la estadstica de prueba
z=
150
s
s2
+ 2
n1 n2
es normal estndar.
Ejemplo 3. 12
Un investigador en el campo educativo sostiene que el mdulo didctico empleado en la enseanza de Matemticas es uno de los factores que influye y determina en el proceso de enseanza aprendizaje y por lo tanto, el mdulo adoptado incidir en el rendimiento
acadmico de los estudiantes. Para verificar su hiptesis decide
realizar el siguiente experimento: durante un semestre se llev a
cabo el trabajo lectivo para dos grupos de estudiantes de la misma carrera en la misma universidad, empleando dos mdulos (A
y B) de caractersticas bien diferenciadas. Al final del curso se aplica
Mtodo A
15
16
15
13
13
16
16
14
Mtodo
13
18
14
17
12
17
13
17
H 0 : 1 = 2
H1 : 1 2
151
a)
b)
c)
Activar el SPSS.
Abrir el archivo de DATOS3-diferentes.
ANALIZE/COMPARE MEANS/ INDEPENDENT-SAMPLE
T-TEST/ llevar a TEST VARIABLE la variable creada RENDIMIENTO/ en GROUPING VARIABLE elegir GRUPO/
DEFINE GROUPS/ en grupo1 colocar 1 y en grupo2 colocar
2/ CONTINUE/ pulsar el comando OK.
En el output del SPSS se tiene directamente el valor de
F
Sig.
df
Sig.
(2-tailed)
p _ value
rendimiento
Equal
variances not
assumed
.139
9.151
.892
Variance
1
2
Total
9
7
16
2.000
5.810
3.396
152
s12 s22
n1 + n2
k=
2
s12 s22
n n
1
2
+
n1 + 1
n2 + 1
[(2 9 )+ (5.81 7 )]
2
2 =
( 2 9 ) + (5.81 7 )
9 +1
2 = 9.15
7 +1
P2 =
A
y
n1
B
, donde es el nmero de elementos con el atributo de inn1
n1P1 + n2 P2
.
n1 + n2
153
Hiptesis
H 0 : 1 = 2
H1 : 1 > 2
H 0 : 1 = 2
H1 : 1 < 2
Estadstico de prueba
zc =
zc =
H 0 : 1 = 2 z =
c
H1 : 1 2
p1 p2
1 1
p (1 p ) +
n1 n2
p1 p2
1 1
p (1 p ) +
n1 n2
p1 p2
1 1
p (1 p ) +
n1 n2
Regla de decisin
Rechazar la hiptesis
H 0 : 1 = 2 , si
p _ value <
p _ value <
zc > zterico
equivalentemente
p _ value <
1 = 2 = , es p =
dstica de prueba
n1 p1 + n2 p2
y se puede usar como la estan1 + n2
p1 p2
. A continuacin se presenta
1 1
p (1 p ) +
n1 n2
el resumen para cada una de las posibles hiptesis alternativas y
las respectivas regiones de rechazo.
Ejemplo 3.13
200 estudiantes fueron divididos aleatoriamente en dos grupos,
cada uno de 100. Los de la muestra 1 aprendieron determinado
material en el cual se enuncia verbalmente el concepto de transiti-
154
p1 =
B 54
A 68
=
= 0.68 y p2 = =
= 0.54
n1 100
n1 100
p=
100(0.68) + 100(0.54)
= 0.61
200
H 0 : 1 = 2
H 0 : 1 2
zc =
p1 p2
1 1
p (1 p ) +
n1 n2
0.68 0.54
1
1
0.61(0.39)
+
100 100
0.14
=2.03
0.06897
12
= 1)
22
frente a la hiptesis alternativa H 0 : 12 22 . Cuando la hipte-
156
S12
tienen distribucin
S22
Estadstico de prueba
H1 :
2
1
s12
Fc = 2
s2
H 0 : 12 = 22
2
2
Regla de decisin
Rechazar la hiptesis
H 0 : 12 = 22 , si
2)
2
x21,...., x2,n 2 de la variable X 2 respectivamente, es: F c= s12 , que
s2
15
16
15
13
13
16
16
Mtodo B
13
14
14
11
12
14
13
14
17
H 0 : 12 = 22 H1 : 12 22
Paso 2: Para obtener el valor de la estadstica de prueba, tomamos
del ejemplo 3.10 los valores de los tamaos de muestra n1 = 9 ,
n2 = 7 y los valores de las varianzas muestrales:
s12 =
1 n2
n1 1 i =1
(x
1i x1
) = 168 = 2
2
2
y s2 =
1 n2
n2 1 i =1
(x
2i x 2
8
= 1.333 . Luego, obtenemos el valor de la estadstica de prueba:
7
s2
2
f c = 12 =
= 1.5
s2 1.33
158
Ejercicios
Usted es un inspector de escuelas pblicas y realiza un experimento para investigar si la habilidad de lectura de estudiantes de
primer ao de secundaria ha mejorado o no. En una muestra aleatoria de 185 estudiantes de esta poblacin encuentra una habilidad media de lectura igual a 75 palabras por minuto. Las notas
nacionales sobre la habilidad de lectura, para los estudiantes del
primer ao de secundaria, muestran una distribucin normal con
media 80 palabras por minuto y una desviacin estndar igual a
12. Todo puntaje por debajo de 80 se considera deficiente. Es razonable considerar que la habilidad de lectura de los estudiantes
de quinto de secundaria es deficiente?. Suponga normalidad y
= 0.10. Use la metodologa correspondiente para dar respuesta a
la pregunta planteada.
El Director Acadmico del centro pre universitario de la
UFV tiene la percepcin de que el rendimiento acadmico durante el primer ao de estudios en la universidad, de los alumnos ingresantes a travs de la institucin que dirige ha sufrido
cambios en los ltimos aos. Sabe que histricamente los alumnos han tenido un rendimiento promedio de 14 puntos. Para confirmar su percepcin llev a cabo un estudio, para el que escogi
una muestra aleatoria de 150 alumnos que ingresaron el ao 2004
a travs del centro pre universitario y pidi al sistema de matrcula el rendimiento de cada uno de estos alumnos durante el ao
acadmico 2004. Para dicha muestra obtuvo de rendimiento pro-
159
medio 14.5 puntos con desviacin estndar 0.5 puntos. Existe evidencia muestral para decir si es cierta la percepcin del Director
Acadmico?. Suponga normalidad y = 0.10. Use la metodologa
correspondiente para dar respuesta a la pregunta planteada.
en mnibus
caminando
x1 = 145
x2 = 135
160
do un rendimiento promedio de 13 puntos. Para confirmar su percepcin llev a cabo un estudio, para el que escogi una muestra
aleatoria de 25 alumnos que ingresaron el ao 2004 a travs del
centro pre universitario que dirige y pidi al sistema de matrcula
el rendimiento de cada uno de estos alumnos durante el ao acadmico 2004. Para dicha muestra obtuvo un rendimiento promedio de 13.9 puntos con desviacin estndar 0.45 puntos. Existe
suficiente evidencia muestral para decir que es cierta la percepcin del Director Acadmico?. Suponga normalidad y use = 0.10
Antes de aplicar el Plan Huascarn en el distrito de Cajatambo, el rendimiento promedio de los estudiantes de primer ao de
primaria era de 12 puntos. Para determinar si el Plan ha sido efectivo en el incremento del rendimiento de los estudiantes, se observaron al azar a 150 estudiantes despus de aplicar el plan durante
un ao acadmico, obtenindose de rendimiento promedio 13.5
puntos con desviacin estndar 2.1 puntos. Al nivel de significacin 0.05 se podra decir que existe evidencia de el rendimiento
promedio ha aumentado?. Use la metodologa correspondiente
para dar respuesta a la pregunta planteada y de ser necesario suponga normalidad.
Hace tres aos el Ministro de Educacin afirm que histricamente la tasa de desercin estudiantil en el nivel primario es
del 20%. En los ltimos dos aos el gobierno ha realizado programas especiales para que dicha tasa disminuya sustancialemte. La
informacin del ao pasado seala que la tasa de desercin fue
del 17%. Qu puede decirse de la afirmacin del Ministro de Educacin?. De ser necesario suponga normalidad y use a) = 0.05
b) Use = 0.10.
Un investigador en el campo educativo sostiene que el mdulo
didctico empleado en la enseanza de Matemticas es uno de los
factores que influye y determina en el proceso de enseanza aprendizaje y por lo tanto, el mdulo adoptado incidir en el rendimiento
Mtodo A
12
13
12
10
10
13
13
11
14
Mtodo B
16
17
117
14
15
17
16
16
15
161
acadmico de los estudiantes. Para verificar su hiptesis decide realizar el siguiente experimento: durante un semestre se llev a cabo
el trabajo lectivo para dos grupos de estudiantes de la misma carrera en la misma universidad, empleando dos mdulos (A y B)
de caractersticas bien diferenciadas. Al final del curso se aplica el
mismo examen y se obtuvo las siguientes notas:
Suponiendo que las muestras provienen de poblaciones
normales con varianzas iguales, los resultados encontrados
por el profesor apoyan la hiptesis de investigacin?. Suponga normalidad de las variables consideradas y use nivel de significacin 0.10.
Un grupo de 350 estudiantes fueron divididos aleatoriamente en dos subgrupos de 100 y 150 estudiantes. Los de la muestra 1
aprendieron determinado material en el cual se enuncia verbalmente el concepto de transitivitas de "ms alto que", a continuacin de lo cual se dieron varios ejemplos de la situacin; a los estudiantes del grupo 2 se les expuso ejemplos tras de lo cual se
enunci verbalmente el concepto. Son dos poblaciones, subyacentes a las muestras y que hubieran podido participar en el experimento. Seguidamente se administr una prueba para determinar
si dominan el concepto de transitividad, pues, se desea saber si en
estas dos poblaciones de estudiantes, las respectivas proporciones 1 y 2 que manejan la transitividad son o no iguales (el criterio es el nmero de respuestas correctas en la prueba de tems). Al
finalizar el experimento, 62 estudiantes de la muestra 1 y 70 estudiantes de la muestra 2 dominaban el concepto de transitividad.
Existe diferencia en las proporciones poblacionales. Use = 0.05.
En una investigacin conducida por una estudiante del doctorado en Educacin las poblaciones fueron las siguientes: los estudiantes del tercer grado de primaria de colegios estatales, cuyas
edades fluctuaban entre 8 aos y 12 aos de edad, residentes en el
Cercado del Distrito del Callao, pertenecientes al estrato socioeconmico bajo, y los estudiantes del tercer grado de primaria de colegios particulares, cuyas edades fluctuaban entre 8 aos y 12 aos
162
de edad, residentes en el Cercado del Distrito del Callao, pertenecientes al estrato socioeconmico medio.
Por el costo de la investigacin, es decir, por razones econmicas, administrativas y algo de dispersin geogrfica se consider conveniente trabajar con dos muestras aleatorias independientes, una de cada una de las poblaciones ya descritas.
Las variables investigadas fueron los puntajes en las siguientes pruebas:
Nivel de p. anlisis fonmico (PAF)
Nivel socio
econmico
BAJO
MEDIO
Variables
PAF
PCF
TEDE
PCL
MEDIA
DESVIACIN
ESTNDAR
TAMAO
MUESTRA
25.1
48.9
67.7
12.5
5.7
6.9
5.5
2.9
15
15
15
15
MEDIA
DESVIACIN
ESTNDAR
TAMAO
MUESTRA
27.5
56.5
91.1
15.4
3.1
6.9
5.5
3.2
18
18
18
18
a)
b)
163
c)
d)
Nivel socio
econmico
BAJO
MEDIO
Variables
PAF
PCF
TEDE
PCL
MEDIA
DESVIACIN
ESTNDAR
TAMAO
MUESTRA
25.1333
58.8333
3.5
3.0
5.1
3.0
35
35
35
35
MEDIA
DESVIACIN
ESTNDAR
TAMAO
MUESTRA
29.5333
65.3667
3.5
3.4
5.0
3.5
40
40
40
40
97.7000 14.3000
102.2667 16.0333
a)
b)
c)
164
d)
En los ejercicios 3.10 y 3.11 haga las correspondientes pruebas de hiptesis para comparar las varianzas poblacionales en cada
uno de los casos. Use = 0.10. Si su decisin es contraria al supuesto que plante con respecto a las varianzas, en cada uno de
los ejercicios, a la luz de los resultados vuelva a resolverlos.
En una investigacin realizada por una estudiante del doctorado en Educacin, la Poblacin objetivo fueron los alumnos matriculados en las diferentes sedes del programa de Formacin Docente Semi-escolarizado y autofinanciado de la Universidad Nacional Faustino Snchez Carrin de Huacho, y que en 1997 fueron
un total de 1500 alumnos.
Por razones econmicas, administrativas y de dispersin geogrfica se consider como poblacin muestreada (objeto de la presente investigacin) las sedes de Barranca, Huacho y Huaral.
Las variables estudiadas fueron:
Rendimiento en la prueba de comprensin lectora.
Notas
Sede
Huacho
Barranca
Huaral
Total
nmero
alumnos
desviacin
estndar
media
muestral
18
7
5
2.80
1.68
1.29
12.0
13.5
13.0
30
165
b)
c)
En una investigacin realizada por una estudiante del doctorado en Educacin, la Poblacin objetivo fueron los alumnos matriculados en las diferentes sedes del programa de Formacin Docente Semi-escolarizado y autofinanciado de la Universidad Nacional Faustino Snchez Carrin de Huacho, y que en 1997 fueron
un total de 1500 alumnos.
Por razones econmicas, administrativas y de dispersin geogrfica se consider como poblacin muestreada (objeto de la presente investigacin) las sedes de Cajatambo, Churn y Copa. Las
variables estudiadas fueron:
Rendimiento en la prueba de comprensin lectora.
Notas
Sede
Cajatambo
Churn
Copa
Total
166
nmero
alumnos
desviacin
estndar
media
muestral
60
35
45
4.80
2.68
2.68
11.0
10.5
13.0
140
b)
c)
En los ejercicios 3.13 y 3.14 haga las correspondientes pruebas de hiptesis para comparar las varianzas poblacionales en cada
uno de los casos. Use Si su decisin es contraria al supuesto que
plante con respecto a las varianzas, en cada uno de los ejercicios,
a la luz de los resultados vuelva a resolverlos.
167