You are on page 1of 63

Captulo III

Pruebas de hiptesis
medias, varianzas, proporciones

Introduccin
Con mucha frecuencia el propsito de la investigacin va ms all
de describir el comportamiento de la variable en la muestra y debemos de generalizar o inferir los resultados obtenidos en la muestra a la poblacin o universo.
Los datos casi siempre son recolectados de una muestra y sus
medidas importantes tales como la media muestral y la varianza
muestral reciben el nombre de estadsticas. Por otro lado, las medidas representativas de la poblacin, media poblacional y varianza poblacional, casi siempre desconocidos, reciben el nombre de
parmetros. Un esquema puede ser el siguiente:

X: variable estudiada

INFERIR LOS RESULTADOS A


LA POBLACION O UNIVERSO

RECOLECCION DE
DATOS EN LA
MUESTRA
PARAMETROS

ESTADISTICAS

[107]

105

El razonamiento de pruebas de hiptesis se emplea para responder preguntas como las siguientes:
1.

2.

3.

106

Aos de experiencia han demostrado que en un examen de


admisin a la Facultad de Educacin de una universidad, los
estudiantes obtienen en media 140 (sobre 240) puntos con desviacin estndar de 10 puntos. En el examen de admisin2004, los postulantes a la Facultad de Educacin han obtenido 160 puntos. Se puede afirmar que estos estudiantes tuvieron un rendimiento significativamente por encima del promedio?.
En los ltimos aos se ha observado que el coeficiente de correlacin entre las notas del curso de inferencia estadstica y
del curso de metodologa de la investigacin de los estudiantes de Maestra en Educacin de una universidad, es 0.65.
La asociacin observada es significativamente diferente de
cero?.
Un profesor del curso de matemticas desea conocer la relacin entre la creatividad y la ansiedad en alumnos de quinto
y sexto ao de secundaria. Al hacer la revisin bibliogrfica
encontr dos tendencias: una de las cuales se inclina a creer
que el pensamiento creativo se relaciona inversamente con la
ansiedad, y la otra, se inclina por la opinin que la creatividad no tiene nada que ver con la ansiedad. Por consiguiente,
nuestro investigador todava no ha tomado partido y trata de
resolver sus dudas mediante un estudio emprico.
Asimismo, ha encontrado que existen dos pruebas que miden con cierta validez ambas variables (creatividad y ansiedad) y que son: la prueba de Getzels y Jackson sobre el "Empleo de Objetos" y la prueba "Children's Manifest Anxiety
Scale" de Castenada, Mc Candless y Palermo.
El profesor sabe que son 20000 los alumnos de quinto y sexto
de secundaria a quienes tendra que aplicar las pruebas de
ansiedad y creatividad, pero sus recursos lo limitan a observar slo 200. Si lleva a cabo su investigacin en la muestra

de estudiantes y obtiene el valor 0.87 para el coeficiente de


correlacin muestral entre las puntuaciones de ansiedad y
creatividad, qu har para llevar ese resultado a la poblacin
de 20000 estudiantes?.
En este captulo y en los siguientes responderemos preguntas
como las planteadas mediante la metodologa de pruebas de hiptesis, en relacin con los siguientes parmetros bsicos en una
2
poblacin: (la media),
(varianza), (proporcin), y los siguientes parmetros bsicos en dos poblaciones: 1 2 (diferencia
de medias), 1 2 (diferencia de proporciones), 1 / 2 (cocien-

te de varianzas), (coeficiente de correlacin).


Se hacen pruebas de hiptesis para decidir, sobre la validez de una proposicin o enunciado que se hace respecto a
algn aspecto de una distribucin de probabilidad, a partir de
la informacin proporcionada por la muestra aleatoria. La decisin que se deba tomar se refiere a la veracidad o falsedad de una
hiptesis.
A continuacin se presentan los conceptos fundamentales y
la metodologa para realizar una prueba de hiptesis.

Formalizacin de conceptos fundamentales


Los investigadores de educacin y ramas afines saben que el enunciar una hiptesis no siempre implica un trabajo cientfico. Una
hiptesis cientfica es el resultado de un pensamiento creativo y
tal vez inspirado, mientras que la hiptesis estadstica es la expresin de una fase de la comprobacin emprica de la hiptesis cientfica.
Hiptesis estadstica
Una hiptesis estadstica es un enunciado o proposicin respecto
a uno o ms parmetros de la poblacin. Una hiptesis estadstica

107

puede ser simple o compuesta. Es simple, cuando la proposicin


caracteriza completamente a la distribucin de la variable aleatoria y en caso contrario se denomina hiptesis compuesta.
A fin de probar una proposicin, es preciso formular una hiptesis denominada nula conjuntamente con otra denominada
hiptesis alternativa.
Ejemplo 3.1
Durante los ltimos semestres, el profesor de Estadstica Aplicada a la Educacin, ha registrado que el rendimiento medio es de
14 puntos para todos sus alumnos, con desviacin estndar 2 puntos. Este ao le ha tocado 40 alumnos sobresalientes porque su
rendimiento medio ha sido de 17 puntos y el profesor los proclama como superiores a todos los alumnos que ha tenido a la fecha.
De acuerdo a estos resultados se aceptar o se rechazar (una de
las siguientes afirmaciones) la hiptesis que:

:El rendimiento promedio de los estudiantes es menor o igual


a 14 puntos.
: El rendimiento promedio de los estudiantes es mayor a 14
puntos.

A una de las afirmaciones, por ejemplo a H 0 , se le llama hiptesis nula.


A la afirmacin H 1 , que es opuesta a la hiptesis nula, se le
llama hiptesis alternativa.
En las investigaciones donde se utilizan pruebas de hiptesis, se parte del supuesto bsico de que la hiptesis nula ( H 0 ) es
verdadera (mientras no se demuestre lo contrario) y el investigador recoger informacin de una muestra aleatoria, para poder
decidir si rechaza o no la mencionada hiptesis. En caso de rechazarla, se acoge a otra hiptesis conocida como la hiptesis alternativa, ( H 1 ).
Los datos de las muestras deben de ofrecer la posibilidad de

108

tomar dos decisiones respecto de la hiptesis nula. La hiptesis


nula es verdadera o es falsa.
Nunca puede concluirse con certeza, a partir de una muestra,
que H 0 es verdadera o falsa ya que lo mximo que se puede afirmar es que H 0 tiene ms probabilidad de ser cierta que falsa.
Consecuencias de una decisin
Como las pruebas de hiptesis se basan en informacin obtenida
en una muestra aleatoria, es posible que se cometan errores. Estos
errores pueden ser de dos tipos:
Error Tipo I: Si la hiptesis nula, H 0 , es verdadera y lo confirmamos con los datos de la muestra, la decisin es correcta y no
se comete ningn error al tomar la decisin de no rechazar la hiptesis nula. Pero, si la hiptesis nula, H 0 , es verdadera y los datos de la muestra conducen a rechazarla, la decisin es incorrecta,
caso en el que se comete el denominado error tipo I.
Error Tipo II: Si la hiptesis nula, H 0 , es falsa y los datos de
la muestra lo confirman, no se comete error. Pero si H 0 es falsa y
los datos de la muestran indican que no debe rechazarse, la decisin es incorrecta, caso en el que se comete el denominado error
tipo II.
Al rechazar o no una hiptesis nula hay 4 situaciones posibles con respecto a la correcta o incorrecta toma de decisin, que
se traducen a continuacin.
A la probabilidad de cometer el error de tipo I se denota con
Situacin real
La hiptesis nula
es verdadera

La hiptesis nula
no es verdadera

Rechazar la
hiptesis nula

error de tipo I
P(I) =

Correcta

No rechazar la
hiptesis nula

Correcta

Decisin

error de tipo II
P(II) =

109

, mientras que a la probabilidad de cometer el error de tipo II se

denota con .

= P (Re chazar

H /H

= P( Aceptar

H /H
o

es verdadera) = P(I)
o

es falsa) = P(II).

Nivel de significacin de la prueba


El nivel de significacin, denominado tambin la probabilidad de
cometer el error de Tipo I, es la probabilidad de rechazar la hiptesis nula siendo sta verdadera,

P( I ) = P(Re chazar

H /H
o

verdadero) = .

(3.1)

Cuando no sea posible rechazar la hiptesis nula, ser preferible indicar que "no existe suficiente informacin como para rechazar la hiptesis nula".
Regla de Decisin
As como en el juicio se debe de tomar una decisin acerca del
acusado: declararlo culpable o inocente, tambin en estadstica
inferencial debe tomarse una decisin acerca de la hiptesis nula:
rechazarla o no rechazarla.
Si se rechaza la hiptesis nula, es porque se encuentran (en la
muestra) resultados significativamente diferentes a lo que debera ocurrir si la hiptesis nula fuera cierta. El no rechazar la hiptesis nula, quiere decir que los resultados no fueron significativamente diferentes de lo que se esperaba, bajo la suposicin de que
la hiptesis nula era cierta.
En todo caso, siempre se debe establecer previamente un criterio para decidir acerca de la hiptesis nula, es decir, qu valores
de la estadstica de prueba (que se describir en el siguiente paso)
delimitan el rechazo de la hiptesis nula. En estadstica, ste pro-

110

ceso se conoce como la determinacin de la regin de rechazo de


la hiptesis nula.
Regin crtica o regin de rechazo de la hiptesis nula
La regin crtica es la regin de rechazo de la hiptesis nula. Se
acostumbra determinar la regin crtica examinando la gravedad
del error tipo I.
Reviste particular importancia especificar exactamente la regin crtica, a fin de que los resultados de este paso no ejerzan
ninguna duda en la ubicacin y el tamao de la regin crtica.
La ubicacin de la regin crtica se determina mediante la forma de la hiptesis alternativa. Esta hiptesis puede tomar tres formas, cada forma dicta una ubicacin especfica de la regin crtica, como se muestra a continuacin.
El procedimiento consiste en observar una muestra aleatoria
Signo en la
hiptesis alternativa
Tipo de la regin
crtica

<

>

una regin al lado dos regiones, una una regin, lado


izquierdo
a cada lado
derecho

y a partir de la informacin que se obtenga se toma una decisin.


Esta informacin generalmente aparece contenida en una expresin que se denomina estadstica de prueba e indica, de alguna
manera, el grado de discrepancia entre la hiptesis nula y los datos observados. Cuando el grado de discrepancia sea grande se
rechazar la hiptesis nula, caso contrario no se rechazar.
Para ilustrar, retomemos el ejemplo 3.1. Establecidas las hiptesis, parece razonable que si se desea probar hiptesis relativas a la media de una poblacin, se elija la media muestral para
analizar la compatibilidad de la muestra con la hiptesis nula.
Si el valor x = 17 es grande con respecto a 14 (el grado de discrepancia entre la hiptesis nula y la muestra es grande), se po-

111

dra rechazar la hiptesis nula. El problema es determinar el rango de valores de x para los que, stos puedan considerarse grandes.
En general, el conjunto de valores de la estadstica de prueba
para los cuales se rechaza la hiptesis nula, se llama regin de
rechazo o regin crtica.
Por ejemplo, se podra tomarse como una regin de rechazo
el intervalo (16, ), de tal manera que si la media muestral encontrada cae en este intervalo, se debe rechazar la hiptesis nula. Esta
decisin es razonable puesto que si la hiptesis nula es verdadera,
la probabilidad de encontrar una media muestral mayor que 16,
en el supuesto de normalidad, es:

16 14
X u
P X > 16 / u = 14 = P Z >
P Z >

= 1 P (Z 6.32 ) =0.000.


40
n

Luego, encontrar una media muestral en el intervalo (16, )


es un evento no consistente con la hiptesis nula, por lo que se
tendr que rechazar la hiptesis nula.
Se podra tomar como otra regin de rechazo el intervalo (14.2,
) y encontrar:

X
14.2 14
P X > 14.2 / = 14 = P Z >
P
Z
>

= 1 P (Z 0.63)
2


40
n

=1- 0.7357=0.2643.

En este caso se observa que existe la posibilidad (aunque pequea) de encontrar un valor de la media muestral en el intervalo
(14.2, ), an cuando la hiptesis nula sea verdadera. Esto implica que podramos equivocarnos al rechazar esta hiptesis cuando
la media muestral cae en este intervalo.
En el ejemplo analizado, lo que se debe es elegir una regin
de rechazo como el intervalo (a, ) adecuada, de tal manera que si
la media muestral cae en este intervalo se rechace la hiptesis nula.
El valor de la constante, a, se elige de tal manera que la probabili-

112

dad de equivocarnos al rechazar la hiptesis nula, siendo sta verdadera, sea un valor pequeo, es decir, sea la probabilidad de
cometer el error tipo I o el denominado nivel de significacin. As
se estara tratando de evitar, en lo posible, el error de una decisin
equivocada.
Por ejemplo, si deseamos cometer el error de tipo I con probabilidad igual a = 0.05, se puede escoger como regin de rechazo, al intervalo (a, ), de manera que:

0.05 = P(Re chazar

H /H
o

es verdadera)

a u
a 14
6.32(a 14)

>
P
Z
=0.05

= 1 P Z
2
2


40
n

= P (X > a / u = 14 ) = P Z >

6.32(a 14)

P Z
= 0.95 . Usando la tabla normal se observa que:
2

6.32(a 14)
= 1.645
2

a 14 = 0.52 a = 14.52

La decisin a tomar es: rechazar la hiptesis nula si la media


muestral es mayor que 14.52.
Luego, la estadstica de prueba es la media muestral y la regin de rechazo, al nivel de significacin = 0.05, es el intervalo
(14.52, ). La probabilidad de equivocarse al rechazar la hiptesis
nula, siendo sta verdadera, es a lo ms = 0.05.
Se observa que, la decisin de rechazar la hiptesis nula
si x > 14.52 , es equivalente a rechazar la hiptesis nula, cuando

x 14
> 1.645 . Luego, en lugar del valor de la media muestral se
2
40
puede considerar el valor de la media muestral estandarizada,

x 14
2
, como la estadstica de prueba y como regin de rechazo
40
de la hiptesis nula, al intervalo (1.645, ).
La decisin puede expresarse de la siguiente manera: rechazar la hiptesis nula si el valor estandarizado de la media mues113

tral, zc =

x 14
, cae en el intervalo (1.645, ).
2
40

Procedimiento de las pruebas de hiptesis

Regin de rechazo
1.645

Una vez que se tienen las ideas que apoyan la metodologa de


pruebas de hiptesis, vamos a presentar, el procedimiento que se
sigue al realizar una prueba de hiptesis.
Paso 1. Identificar el problema
En general, los problemas de inferencia estadstica plantean el estudio de uno o ms parmetros. Entre los parmetros que se estudian con mayor frecuencia son los siguientes:
El valor de la media de una variable aleatoria en la poblacin, parmetro que ya hemos denominado con u.
El valor de la diferencia de medias de una variable aleatoria
en una misma poblacin o en poblaciones diferentes, 1 2 .
2
El valor de la varianza de una variable en la poblacin, .
El valor de la proporcin de una variable en la poblacin, .
El valor de la diferencia de proporciones de una misma poblacin o de poblaciones diferentes, 1 2.
El valor del cociente de varianzas de una variable en una misma poblacin o en poblaciones diferentes, 1 / 2 .
El valor del coeficiente de correlacin poblacional para dos
variables, 12 .

114

Asociados a los parmetros existen estimadores de los parmetros que se han presentado en el captulo anterior y que se resumen a continuacin:
Es necesario recordar que cuando se observa la muestra, el estimador de un parmetro, es una funcin de variables aleatorias y
Parmetro
Notacin

Nombre

media poblacional

media muestral

varianza muestral

diferencia de
medias muestrales

x x

diferencia de medias
poblacionales

X X

cociente de varianzas
poblacionales

S /S

diferencia de
proporciones
poblacionales

P P

Notacin

Nombre

Estimaciones
con los valores
de la muestra

varianza poblacional

Estimadores

cociente de
varianzas
muestrales
diferencia de
proporciones
muestrales

s /s

pp
1

por lo tanto variable aleatoria, toma un valor y recibe el nombre de


estimacin del parmetro. As por ejemplo, X 1 ,..., X n es una muestra aleatoria desde la poblacin donde la variable aleatoria X tiene media y varianza 2. El estimador de la media poblacional,

1 n
X i y si los valores observados de la muesn i =1
tra son x1 = 25, x2 = 30, x3 = 40, x4 = 20, x5 = 35 , el valor ob1 n
150
servado de la media muestral es, x = xi =
= 30 y se de5
n i =1

, es la funcin X =

nomina estimacin de la media poblacional.

Esta aclaracin se hace extensiva para los otros parmetros,


estimadores y sus correspondientes estimaciones.
Paso 2. Plantear las hiptesis

115

Se plantean conjuntamente la hiptesis nula y la hiptesis alternativa.


Hiptesis Nula La palabra "nula" trasmite la idea de " ninguna
diferencia". Como regla general debemos comenzar con la afirmacin: no hay razn para creer que la sospecha que se tiene sea
verdadera.
La hiptesis nula se expresa de alguna de las siguientes
formas:
Hiptesis Alternativa Al plantear esta hiptesis, generalmente,
debe recordarse el propsito de la investigacin: buscar evidencia

H 0 : Parmetro = w
zona de no rechazo
de la hiptesis nula

zona de rechazo
De la hiptesis

Zona de rechazo
de la hiptesis nula

: Parmetro w
zona de no rechazo
de la hiptesis nula

Zona de rechazo
de la hiptesis nula

: Parmetro w
zona de no rechazo
de la hiptesis nula

w
donde " w" es un valor conocido.

116

zona de rechazo
de la hiptesis nula

que permita rechazar la hiptesis nula. Por lo general la hiptesis


alternativa coincide con la sospecha que se tiene y es la negacin
de la hiptesis nula. Para los tres casos mencionados anteriormente
las hiptesis alternativas son:

H
H
H

: parmetro w

: parmetro < w

: parmetro > w

En el caso de que la alternativa no indique ninguna direccin


especfica, se dice que la prueba es de dos colas o bilateral.
Paso 3. Seleccionar la herramienta de anlisis
Por lo general, en estadstica inferencial se encuentra ms de una
herramienta para enfrentar un mismo tipo de problema. Emplearemos herramientas del campo de la estadstica conocido como
estadstica paramtrica. Algunas de las herramientas ms usadas
son: la media muestral X para inferir acerca de una media poblacional u, la diferencia de medias muestrales X 1 X 2 para inferir
acerca de una diferencia de medias poblacionales 1 2 , la diferencia de proporciones muestrales P1 P2 para inferir acerca de una
diferencia de proporciones poblacionales 1 2 , el cociente de
2
2
varianzas muestrales S1 / S 2 para inferir acerca de un cociente de
2
2
varianzas poblacionales 1 / 2 .
Paso 4. Seleccionar el modelo terico
Para cada herramienta de anlisis tal como X , X 1 X 2 , P1 P2 ,
2
2
S1 / S 2 , existe una distribucin muestral terica asociada. Ya se present en el captulo 1, las distribuciones muestrales asociadas a la
media muestral, a la diferencia de medias muestrales, a la diferencia de proporciones muestrales, al cociente de varianzas muestrales, las que usaremos en el presente captulo.

117

Paso 5. Regin de rechazo y anlisis del nivel de


significacin
Debe adoptarse un grado de riesgo de concluir errneamente
que H 0 es falsa con base en la evidencia suministrada por la
muestra. Tal riesgo enunciado en forma de probabilidad se
conoce como el nivel de significacin del contraste de hiptesis o
el riesgo.
Una vez escogido el modelo para representar el comportamiento de la estadstica muestral escogida para el anlisis, determinar el nivel de significacin es un problema de clculo y de interpretacin de la tabla de la distribucin del correspondiente
modelo. Sabemos que el nivel de significacin de una prueba de
hiptesis, denotado por , es la probabilidad que existe de rechazar la hiptesis nula. En trminos de las Figuras que se presentan
a continuacin, el nivel de significacin es el rea de la regin de
rechazo de la hiptesis nula. Generalmente se usan los valores:
0.05; 0.025; 0.001 y 0.0005 para .
En el caso de que la prueba de hiptesis alternativa sea de
dos colas, es la suma de las dos reas de las regiones de rechazo.
Es decir, si = m% en una prueba de dos colas, entonces el rea
de cada una de las regiones de rechazo debe ser (m/2)%.
A continuacin veamos un ejemplo del manejo del nivel de
significacin cuando la estadstica de prueba tiene distribucin
normal estndar.
a)

Cuando la hiptesis alternativa es H 1 : u > w y la probabilidad


de rechazar la hiptesis nula siendo sta verdadera es = 0.05;
se plantea que P (Z > z ) = 0.05 y en la tabla normal estndar se
encuentra zterico = 1.645 . Es decir P (Z > 1.645) = 0.05 , por lo
que la regin crtica es el intervalo (1.645, ).
Figura 3.1

118

1.645

b)

Cuando la hiptesis alternativa es H 1 : u < w y la probabilidad

d e
rechazar la hiptesis nula siendo verdadera es = 0.05; se plantea que P (Z < z ) = 0.05 y en la tabla normal estndar se encuentra zterico = 1.645. Es decir, P (Z < 1.645) = 0.05 , por lo
que la regin crtica es el intervalo (- , -1.645 ).
c)

Cuando la hiptesis alternativa es H 1 :


Figura 3.2

u w y la probabili-

-1.645

dad de rechazar la hiptesis nula siendo verdadera es = 0.05;


se plantea P Z > z = P (Z > z ) + P (Z < z ) = 0.05 y en la tabla normal estndar se encuentra zterico = 1.96 . Es decir,
P Z > 1.96 = P (Z > 1.96 ) + P (Z < 1.96 ) = 0.05 , por lo
que la regin crtica es el intervalo (-, -1.96) U(1.96, ).

Paso 6. Decisin

de rea 0.025

-1.645

-1.645

0.025 de rea

119

Una vez realizados los pasos anteriores, la decisin acerca de la


hiptesis nula H 0 , es simplemente cuestin de mirar dnde cae
el valor de x estandarizado (para lo cual se observa una muestra
aleatoria)
Segn dnde quede ubicado el valor del estimador muestral
habr que: rechazar o no rechazar la hiptesis nula.
A continuacin se presenta un ejemplo para ilustrar el desarrollo de una prueba de hiptesis en el que se resume los pasos
anteriores.
Ejemplo 3.2
El Director Acadmico del centro pre universitario de la UNMSM
tiene la percepcin que el rendimiento acadmico durante el primer ao de estudios en la universidad, de los alumnos ingresantes a travs de la institucin que dirige mejora ao a ao. Sabe que
histricamente los alumnos han tenido un rendimiento promedio
de 13 puntos con desviacin estndar 1 punto. Para confirmar su
percepcin llev a cabo un estudio, para el que escogi una muestra aleatoria de 100 sanmarquinos que ingresaron el ao 2004 a
travs del centro pre universitario de la universidad y pidi al sistema de matrcula el rendimiento de cada uno de estos alumnos
durante el ao acadmico 2004. En dicha muestra el rendimiento
promedio fue 14 puntos. Veamos si existe suficiente evidencia
muestral para decir si es cierta la percepcin del Director Acadmico. = 0.05.
Solucin
Paso 1: Planteamiento de las hiptesis
Se trata de un problema de inferencia estadstica acerca de la media poblacional.
: " rendimiento acadmico promedio durante el primer ao

120

de estudios en la UNMSM, de alumnos ingresantes a travs del


centro pre universitario de la universidad. Se plantea la hiptesis
nula juntamente con la hiptesis alternativa.
Hiptesis nula: Se plantea como que no pasa nada. Se debe de
interpretar como: "el rendimiento medio u =13 puntos, es decir:
Ho: = 13.
Hiptesis alternativa: Debe plantearse como la posibilidad sobre
la cual se tiene sospechas. En este caso, el Director Acadmico tiene la sospecha que el rendimiento promedio ha mejorado. Es decir, la hiptesis alternativa es:

H a : : > 13
Como la hiptesis alternativa es de la forma ">", la prueba de
hiptesis que se est planteando es unilateral o de una cola hacia
el lado derecho y la regin crtica ser de la forma(a, ).
Paso 2 Seleccin de la herramienta de anlisis, del modelo y
obtencin de la regin crtica
La herramienta de anlisis que se utilizar es la media muestral y
su valor es x =14 puntos.
Hemos visto en el captulo 1 que el comportamiento de la
media muestral X se puede modelar de una manera aproximada
con la distribucin normal. Puesto que la varianza de toda la poblacin se supone conocida, usaremos el hecho que:

Z=

tiene distribucin N(0,1).


Si se elige el nivel de significacin del =0 .05, el espacio muestral queda dividido en dos regiones disjuntas, la regin de rechazo de la hiptesis nula y la regin de no rechazo de la hiptesis

121

nula.
En la tabla normal, el valor de z que cumple P (Z > z ) = 0.05 =
, es z = zterico = 1.645.
Luego, la regin crtica o de rechazo de la hiptesis nula es el
intervalo (1.645, ).
Regin de rechazo de H0

Paso 3. Tomar la
1.645

muestra y obtener

zc

Con la informacin de la muestra observada y bajo el supuesto de


que la hiptesis nula es verdadera, la estadstica de prueba toma
el valor 10. Es decir:

zc =

x 0 14 13
=
= 10, es el valor muestral estandariz ado.
1

100
n

Paso 4. Decidir
Se puede ver que el valor muestral estandarizado o el valor de la
estadstica de prueba, zc = 10 , se ubica en la regin de rechazo de
la hiptesis nula, es decir pertenece al intervalo (1.645, ), por lo
que la decisin es rechazar la hiptesis nula.
Con un nivel de significacin = 0.05, existe evidencia para
afirmar que es posible que la percepcin del Director Acadmico
sea cierta.
Observacin 1
Es importante sealar que los softwares estadsticos como el SPSS,
reportan el nivel crtico de la prueba o p-value, en lugar de indi-

122

car un determinado valor del nivel de significacin . Esto facilita


la lectura de los resultados y concede al investigador, sobre la base
del valor de p-value, la libertad de rechazar o no la hiptesis nula.
Es decir, la decisin: rechazar la hiptesis nula porque el valor de zc = 10 es mayor que el valor encontrado en la tabla normal, z = 1.96 ; es equivalente a la decisin: rechazar la hiptesis
nula porque el nivel crtico de la prueba, P (Z > 10) = 0.00 , es
menor que el valor del nivel de significacin, = 0.05 . Es decir,
rechazar la hiptesis nula porque P (Z > 10 ) = 0.000 es menor que
= 0.05 . Esta es la regla que se usar toda vez que se trabaje con
el software estadstico SPSS.

Pruebas de hiptesis en poblaciones normales


Pruebas de hiptesis en una poblacin normal
Vamos a presentar el procedimiento de pruebas de hiptesis en el
supuesto de poblaciones normales, es decir bajo el supuesto que
la variable aleatoria X tiene distribucin normal con media u y
2
varianza .
Los tpicos a ser tratados son: pruebas de hiptesis para la
media poblacional, para la varianza poblacional, para la diferencia de medias, para la diferencia de proporciones y para el cociente de varianzas.
Para la media poblacional cuando la varianza poblacional es conocida
Supongamos que la variable aleatoria X tiene distribucin normal
2
con media u y varianza conocida. En el captulo anterior hemos visto que la distribucin de la variable estandarizada,
X
Z=
, es N(0,1), donde X es la media muestral. Se usar

n
este resultado para ilustrar el procedimiento para contrastar hiptesis, cuando la hiptesis alternativa tiene el sentido ">". Los

123

pasos se resumen a continuacin:


Paso 1: Se plantean las dos hiptesis, nula y alternativa:

H
H

: = 0

: > 0

Paso 2: Se toma una muestra aleatoria de tamao n y se obtiene el valor de la media muestral. Luego, se obtienen el valor
de la estadstica de prueba zc =

x u0
, que corresponde a una

distribucin normal estndar cuando la hiptesis nula es verdadera.


Paso 3: Se encuentra la regin crtica para un nivel de significacin prefijado, , de manera que P (Z > zterico ) = . La regin crtica ser el intervalo ( zterico , ), donde zterico es el valor de la
abscisa de la distribucin normal estndar tal que el rea de la
derecha de la curva vale 0.05.
Paso 4: Se rechaza la hiptesis nula frente a la hiptesis alternativa si el valor de zc obtenido en el paso 2 cae en la regin de rechazo de la hiptesis nula, es decir, si cae en el intervalo ( zterico , ).
De la misma manera es posible indicar las reglas para los casos donde la hiptesis alternativa es: H 1 : < 0 o H 1 : 0 . En
la siguiente tabla se resume los diversos casos de la prueba de
hiptesis respecto de la media de una poblacin normal con varianza conocida. Se incluye en cada caso la regin de rechazo correspondiente.
Ejemplo 3.3

124

Hiptesis

Estadstico de prueba

Regla de decisin
Rechazar la hiptesis,

H
H

: = 0

: > 0
1

zc =

x 0

: u = u0 si

zc > zterico ( zterico , )


con el SPSS:

p _ value <

H
H

: = 0

: < 0

zc =

x 0

zc < zterico o (-, - zterico )


Con el SPSS:

p _ value <

: = 0

zc =

x 0

zc > zterico
equivalentemente

zc > zterico zc < zterico


Con el SPSS:
p _ value < / 2

Usted es un inspector de escuelas pblicas y realiza un experimento para investigar si la habilidad de lectura de estudiantes de
quinto ao de primaria. En una muestra aleatoria de 100 estudiantes de esta poblacin encuentra una habilidad media de lectura
igual a 70 palabras por minuto. Las notas nacionales sobre la habilidad de lectura, para los estudiantes del quinto ao de primaria, muestran una distribucin normal con media 75 palabras por
minuto y una desviacin estndar igual a 12. Todo puntaje por
debajo de 75 se considera deficiente. Es razonable considerar que
la habilidad de lectura de los estudiantes de quinto de primaria es
deficiente?. Use = 0.05.
Solucin

125

Paso 1: Planteamiento de las hiptesis


Se trata de un problema de inferencia estadstica acerca de la media poblacional, con varianza poblacional conocida.
: " el nmero promedio de palabras que leen por minuto los
estudiantes de quinto ao de primaria.
Hiptesis nula: Se plantea como que no pasa nada. El nmero
promedio de palabras que leen los estudiantes, u, es de 75 palabras por minuto, es decir:
Ho: u = 75
Hiptesis alternativa: El nmero promedio de palabras que leen los
estudiantes ha disminuido. Es decir, la hiptesis alternativa es:
Ha:

u < 75

Paso 2: Tomar la muestra y obtener el valor de

zc

Con la informacin de la muestra observada y bajo el supuesto de


que la hiptesis nula es verdadera, la estadstica de prueba toma
el valor -5.1. Es decir:

zc =

x 70 75
=
= 5.10.

12
150
n

Paso 3: encontrar la regin crtica


Como la hiptesis alternativa es de la forma "<", la prueba de hiptesis que se est planteando es unilateral o de una cola hacia el
lado izquierdo, de la forma (-, a ), donde " a " es la abcisa de la
distribucin normal estndar y cumple P (Z < a ) = 0.05) .
Si se elige el nivel de significacin del = 0.05, el espacio muestral queda dividido en dos regiones disjuntas como la siguiente:

126

En la tabla normal, el valor de z = zterico que cumple


P (Z < zterico ) = 0.05 = , es zterico = -1.645.
Luego, la regin crtica es el intervalo: (-, -1.645).

-1.645

Paso 4: Decisin
El valor muestral estandarizado, zc = -5.1 encontrado en el paso
2, es menor que el valor terico zterico = -1.645; es decir, se cumple
zc = 5.10 < zterico = 1.645 , por lo que la decisin es rechazar la
hiptesis nula. Con un nivel de significacin = 0.05, es posible
que la habilidad de lectura de estudiantes de quinto ao de primaria sea deficiente.
Nivel crtico de una prueba( p _ value )
La manera cmo se encontr la regin de rechazo dependi del
valor del nivel de significacin escogido de antemano. El valor
proporciona una medida de la significacin de la inferencia realizada; sin embargo ste no indica hasta qu grado la prueba es
significativa. As para las hiptesis:
Ho: u = 75
Ha: u < 75,
los valores estandarizados de la media muestral z = -5.10
y por ejemplo z = -2.5 son significativos al nivel de significacin
= 0.05. Ambos valores caen en la regin de rechazo de la prueba (, -1.645)
El valor de la media muestral estandarizada z= -5.10, presen-

127

ta mayor evidencia para rechazar la hiptesis nula, que el valor


de la media muestral estandarizada z= -2.5, porque la probabilidad de encontrar un valor de la media muestral menor que -5.1 es
menor que la probabilidad de encontrar un valor menor que -2.5.
El valor -5.1 indica que existe mayor discrepancia entre la media
muestral y el valor uo sealado en la hiptesis nula.
As, una manera de medir el grado de discrepancia entre la
media muestral observada y la hiptesis nula se obtiene calculando la probabilidad de observar un valor del estadstico de prueba
ms extremo que el valor estandarizado observado de la media
muestral. A esta probabilidad se le llama nivel crtico de la prueba ( p _ value en el idioma ingls).
As, el nivel crtico de la prueba, cuando el valor de la media
muestral estandarizada es z = -2.5, es P (Z 2.5) = 0.0062. Si la
hiptesis nula es verdadera, la probabilidad de encontrar un valor de la media muestral estandarizada menor o igual a -2.5 es
muy pequea (0.0062) y menor al nivel de significacin dado. Se
decide aceptar que la hiptesis nula es falsa.
Cuando el valor estandarizado de la media muestral es
z = -5.1, el nivel crtico de la prueba o p _ value es P (Z 5.1)=
0.0000. Si la hiptesis nula es verdadera, la probabilidad de encontrar un valor de la media muestral estandarizada menor o igual
a -5.1 es cero. No queda otro camino que rechazar la hiptesis nula.
Cuanto menor sea el valor de p-value, mayor ser la discrepancia entre los datos observados y la hiptesis nula.
Para la media poblacional con varianza
poblacional desconocida
Se supone que la variable X tiene distribucin normal con media u
2
y varianza desconocida. En este caso el procedimiento para
realizar la prueba de la hiptesis H 0 : = 0 frente a cualquiera
de las alternativas: H 1 : > 0 , H 1 : < 0 , H 1 : 0 , es similar al
caso de varianza conocida, slo que en lugar de usar la esta-

128

dstica de prueba con valores

zc =

x 0

se usa la estadstica de
n

x 0
s
. Se ha visto en el captulo 1 que la variable aleaprueba
n
X
t=
S
toria
tiene distribucin t-Student con ( n 1 ) grados de
n
tc=

libertad.
Se usar este resultado para ilustrar el procedimiento para
contrastar hiptesis, cuando la hiptesis alternativa tiene el sentido ">". Los pasos se resumen a continuacin:
Paso 1: Se plantean las dos hiptesis, nula y alternativa:

H : =
H 1 : > 0
0

Paso 2: Se toma una muestra aleatoria de tamao n y se obtiene el


valor de la media muestral y finalmente se obtiene el valor de la
estadstica de prueba tc =

x 0
.
s
n

Paso 3: Se encuentra la regin crtica, para el nivel de significacin P(t( n 1) > tterico ) = , donde tterico es el valor de la abcisa de la
distribucin t-Student con (n-1) grados de libertad, que deja de
rea al lado derecho de la curva.
La regin crtica es el intervalo ( tterico , ).
Paso 4: Se decide rechazar la hiptesis nula frente a la hiptesis
alternativa si el valor de la estadstica de prueba tc cae en la regin ( tterico , ).
De la misma manera es posible indicar las reglas para los casos donde la hiptesis alternativa es: H 1 : < 0 o H 1 : 0 . En

129

la siguiente tabla se resume los diversos casos de la prueba de


hiptesis respecto de la media de una poblacin normal con varianza desconocida.
Ejemplo 3.4
Hiptesis

Estadstica de prueba

Regla de decisin
Rechazar la hiptesis

H
H

: = 0
: > 0
1
0

H
H

H
H

: = 0
: 0
1

: = 0
: < 0

tc =

tc =

tc =

x 0
s
n
x 0
s
n
x 0
s
n

: u = u0 , si

tc > tterico
p _ value <

tc < tterico
p _ value <

tc > tterico
equivalentemente

tc > tterico

tc < tterico

p _ value < / 2

P (t( n 1) > tterico ) =

El Director Acadmico del centro pre universitario de la UFV tiene la percepcin de que el rendimiento acadmico durante el primer ao de estudios en la universidad, de los alumnos ingresantes a travs de la institucin que dirige mejora ao a ao. Sabe que
histricamente los alumnos han tenido un rendimiento promedio
de 13 puntos. Para confirmar su percepcin llev a cabo un estudio, para el que escogi una muestra aleatoria de 20 alumnos que

130

ingresaron el ao 2004 a travs del centro pre universitario que


dirige y pidi al sistema de matrcula el rendimiento de cada uno
de estos alumnos durante el ao acadmico 2004. Para dicha muestra obtuvo un rendimiento promedio de 14.5 puntos con desviacin estndar 1.5 puntos. Veamos si existe suficiente evidencia
muestral para decir si es cierta la percepcin del Director Acadmico. = 0.05.
Solucin
Paso 1: Se plantean las hiptesis
Se trata de un problema de inferencia estadstica acerca de la media poblacional con varianza poblacional desconocida.
u: " rendimiento acadmico promedio durante el primer ao
de estudios en la UFV, de alumnos ingresantes a travs del centro
pre universitario de la universidad.
Hiptesis nula: El rendimiento medio es u=13 puntos, es decir:

H 0 : u = 13
Hiptesis alternativa: Se tiene la sospecha que el rendimiento promedio ha mejorado. Es decir, la hiptesis alternativa es:

H 1 : u > 13
Paso 2: Se toma la muestra y calcula

tc

Bajo el supuesto de que la hiptesis nula es verdadera, la estadstica de prueba toma el valor 4.47, es decir:

tc =

x 0 14.5 13
=
= 4.47.
s
1.5
n
20

Paso 3: Se obtienen la regin crtica

131

Para el nivel de significacin = 0.05 y prueba unilateral del sentido mayor, se cumple que P t(19 ) > tterico = 0.05 . En la tabla t-Student, el valor de tterico con 19 es: tterico = 1.729. Luego, la regin
crtica es el intervalo (1.729, ).

Paso 4: Decisin
Se puede ver que el valor de tc = 4.47 cae en la regin de rechazo
de la hiptesis nula. Es decir: tc = 4.47 > tterico = 1.729 , por lo que la
decisin es rechazar la hiptesis nula. Con un nivel de significacin = 0.05, es posible que la percepcin del Director Acadmico
sea cierta.
Ejemplo 3.5
Un estudiante de maestra investiga un mtodo que supuestamente
modifica la edad en la cual los nios comienzan a hablar, edad
que histricamente es 11 meses. Aplic su mtodo y luego ha hecho el seguimiento a 19 nios y ha registrado las siguientes edades (en meses) en la que dichos nios pronunciaron las primeras
palabras.
10 10 11 16 17 16 14 12 12 13 9 10 12 12 10 17 13 15 18
Al estudiante de maestra le preocupa: a) Identificar el problema. b) Plantear la hiptesis nula y la hiptesis alternativa. c)
Para un nivel de significacin 0.05, quiere saber si funcion o no el
mtodo que aplic.
Solucin
Primero se realizan los clculos auxiliares para obtener los valores de las estadsticas descriptivas media muestral x y desviacin
estndar muestral, s; para luego calcular el valor de la estadstica
de prueba, tc . Los estudiantes que necesitan mayores detalles re-

132

mitirse al libro: Estadstica Descriptiva con auxilio del SPSS y Matlab


(Gmez y et.al, 2005).
Los clculos auxiliares son:
A continuacin se detalla la solucin.
Edades

xi

Nmero
de nios f i

xi f i

1
4
1
4
2
1
1
2
2
1
19

9
40
11
48
26
14
15
32
34
18
247

9
10
11
12
13
14
15
16
17
18

x=

1 k
= 13 ,
fi = 247
n i =1 xi
19
1 k

n 1 i =1

(x x)

(x x) (x x)
2

16
9
4
1
0
1
4
9
16
25

fi

16
36
4
4
0
1
4
18
32
25
140

n = 19 es el tamao de muestra.

f i = 140 = 7.777

18

S = 2.7888

Paso 1: Planteamiento de las hiptesis


Se trata de un problema de inferencia estadstica acerca de la media
poblacional con varianza poblacional desconocida. As, : es la edad
media en la que los nios pronuncian sus primeras palabras.
Hiptesis nula: La edad promedio que histricamente los nios
pronuncian sus primeras palabras es = 11 meses, es decir:

H 0 : = 11
Hiptesis alternativa: La sospecha del estudiante de maestra y
la informacin en la muestra nos dice que ese promedio ha sido

133

superado. As la hiptesis alternativa es:

H 1 : > 11
Como la hiptesis alternativa es de la forma ">", la prueba de
hiptesis que se est planteando es unilateral o de una cola hacia
el lado derecho.
Paso 2: Con la informacin de la muestra y bajo el supuesto de
que la hiptesis nula es verdadera, la estadstica de prueba toma
el valor 3.126, porque:

tc =

x 0
13 11
=
= 3.126
s
2.7888
n
19

Paso 3: Para el nivel de significacin = 0.05, el valor de tterico con


18 grados de libertad, se cumple la condicin P (t(18) > tterico ) = 0.05 =
, entonces tterico = 1.734.
Luego, la regin de rechazo es el intervalo (1.734, ).
Paso 4: Se puede ver que el valor del estadstico de prueba cumple, tc = 3.126 > tterico = 1.734 , es decir, el estadstico de prueba
se ubica en el intervalo (1.734, ). El investigador puede rechazar
la hiptesis nula e indicar que existe un cambio significativo en la
edad en que los nios pronuncian sus primeras palabras (con su
nuevo mtodo).
En la mayora de las investigaciones el tamao de muestra es
grande y los clculos para encontrar el valor de tc son tediosos,
por lo que hemos decidido apoyarnos en nuestro trabajo estadstico con el Software SPSS. En el libro Estadstica Descriptiva con soporte del SPSS y Matlab (Gmez y colaboradores, 2005), dirigido a
investigadores y estudiantes de educacin, ciencias sociales y reas
afines; se explica con detalle todos los pasos a seguir desde la declaracin de variables hasta el manejo de cada uno de los procedimientos estadsticos. A continuacin, en cada uno de los proble-

134

mas que lo requiera, en el presente y en captulos posteriores, se


dar por entendido que el estudiante tiene alguna familiaridad
con la declaracin de variables y creacin de base de datos y centraremos nuestra atencin en los comandos del SPSS que se usarn para realizar los procedimientos estadsticos correspondientes.
Ejemplo 3.6
Resolveremos el ejemplo 3.5 usando el auxilio del SPSS. A continuacin se detallan los pasos a seguir.
Paso 1: Es igual a la solucin del problema 3.5.
Paso 2: Con el auxilio del SPSS debemos de:
a)
b)

Activar el SPSS.
Crear el archivo DATOS1- nios y declarar la variable EDAD
con los valores que ha tomado dicha variable en el ejemplo anterior. Luego se ejecutarn los siguientes comandos del SPSS
que permitirn encontrar el valor de tc que luego se comparar con el valor de tterico encontrado en la tabla t-Student.
ANALIZE/COMPARE MEANS/ ONE-SAMPLE T-TEST/
llevar a TEST VARIABLE la variable creada EDAD/ en TEST
VALUE colocar 11 (el valor de la media poblacional bajo la
hiptesis nula)/ pulsar el comando OK.
En el output del SPSS se lee el valor de tc = 3.126 .
Paso 3: Es igual a la solucin del problema 3.5.

One-Sample Test
Test Value = 11
T
edad

3.126

135

Paso 4: Igual a la decisin tomada en el ejemplo 3.5.


Se puede ver que el estadstico de prueba tc = 3.126 > tterico = 1.734 ,
es decir, la estadstica de prueba se ubica en el intervalo (1.734, ),
que es la regin de rechazo correspondiente al nivel de significacin 0.05. El investigador puede rechazar la hiptesis nula e indicar que existe un cambio significativo en la edad en que los nios
pronuncian sus primeras palabras (con su nuevo mtodo).
Cuando la variable aleatoria tiene cualquier distribucin y con muestras grandes
Cuando el tamao de muestra que se toma es suficientemente grande (mayor que 30), an cuando no se conozca la distribucin de la
variable X, por el teorema del lmite central, los estadsticos:

Z=

t =

X
S
n

tienen distribucin aproximadamente normal y pueden usarse


para probar hiptesis referentes a la media poblacional.
Ejemplo 3.7
Antes de aplicar el Plan Huascarn en el distrito de Copa el rendimiento promedio de los estudiantes de primer ao de primaria
era de 12 puntos. Para determinar si el Plan ha sido efectivo en el
incremento del rendimiento de los estudiantes, se observaron al
azar a 96 estudiantes y se aplic el Plan Huascarn durante un
ao acadmico, obtenindose de rendimiento promedio 11.5 puntos con desviacin estndar 2.8 puntos. Al nivel de significacin
0.05 se podra decir que existe evidencia que el rendimiento promedio ha disminuido?.

136

Solucin
Paso 1: La hiptesis nula indica que no existe diferencia en el rendimiento promedio, mientras que la hiptesis alternativa dice que
aplicando el Plan Huascarn el rendimiento promedio ha disminuido. As:

H 0 : = 12 versus H1 : < 12 .
Paso 2: La muestra usada es suficientemente grande, por lo que la
media muestral tiene distribucin aproximadamente normal y el
valor de la estadstica de prueba es -1.75, porque:

zc =

x 0 11.5 12
=
= 1.75
s
2.8
n
96

Paso 3: Para = 0.05, P (Z < zterico ) = 0.05 = , por lo que zterico = 1.645. Luego, la regin de rechazo es el intervalo (- , -1.645).
Paso 4: Como el valor del estadstico de prueba zc = -1.75 cae en
el intervalo indicado se rechaza la hiptesis nula; existe evidencia
de que el rendimiento acadmico de los estudiantes ha disminuido.
Para la proporcin de una poblacin grande
En algunas situaciones el parmetro sobre el que se trata de evaluar la hiptesis es la proporcin de elementos con cierta caracterstica A () en una poblacin. Por ejemplo, la proporcin de estudiantes que desaprueban el curso de matemticas, la proporcin
de estudiantes motivados, la proporcin de padres de familia que
asisten a la convocatoria realizada por el director del colegio.
Especficamente se trata de probar la hiptesis:

H0 : = 0
frente a una de las siguientes hiptesis alternativas:

137

H1 : < 0

H1 : > 0

H1 : 0

Se ha visto en el captulo 1, que bajo la hiptesis nula, la expresin Z =

P 0
tiene distribucin aproximadamente
0 (1 0 )
n

N(0,1). A continuacin se presenta el resumen de las hiptesis contrastadas, la estadstica de prueba y la regla de decisin.
donde P es el estimador del parmetro , y p es el valor que
toma la variable aleatortia P cuando se observa la muestra.
Ejemplo 3.8
Hiptesis

Estadstico de prueba

Regla de decisin
Rechazar la hiptesis
: = , si

H
H

: = 0
: > 0
0

zc =

p 0
0 (1 0 )

zc > zterico
n

con el SPSS:

p _ value <

H
H

: = 0
: < 0
0
0

zc =

p 0
0 (1 0 )

zc < zterico
n

Con el SPSS:

p _ value <

H : =
H :
0

0
0

zc =

p 0
0 (1 0 )

zc > zterico

equivalentemente

zc > zterico zc < zterico


Con el SPSS:

p _ value < / 2

Hace tres aos el Ministro de Educacin afirm que histricamente el 30% de alumnos que estudian en zonas rurales abandonan
sus estudios al culminar el tercer ao de primaria. En los ltimos
138

dos aos el gobierno ha realizado inversiones en infraestructura y


docencia en dichas zonas rurales con la esperanza de revertir el
resultado planteado por el Ministro. Con el fin de evaluar los cambios, despus de dos aos, se tom una muestra aleatoria de 500
estudiantes de zonas rurales y se encontr que 100 de ellos abandonaron los estudios al culminar el tercer ao de primaria. Qu
puede decirse de la afirmacin del Ministro de Educacin?. Usaremos = 0.05.
Solucin
Paso 1: La hiptesis nula indica que la proporcin de estudiantes
que abandona sus estudios es del 30%, mientras que la hiptesis
alternativa dice que esa proporcin ha disminuido. As:

H 0 : = 0.30 versus

H 1 : < 0.30 , donde 0 = 0.30 .

Paso 2: La muestra usada es suficientemente grande, por lo que la


proporcin muestral tiene distribucin aproximadamente normal.
En la muestra que se observa se encontr p = 0.2 , por lo que el
valor del estadstico de prueba es -4.88, porque:

zc =

p 0
0 (1 0 )

0.2 0.3
= 4.88
0.3(0.7)
500

Paso 3: Para =0.05, P (Z < zterico ) = 0.05 =, por lo que= zterico -1.645.
Luego, la regin de rechazo es el intervalo (- , -1.645).
Paso 4: Como el valor del estadstico de prueba

zc =-4.88 cae en el

intervalo indicado, se rechaza la hiptesis nula. Cuando = 0.05 ,


existe evidencia para afirmar que la proporcin de estudiantes que
abandonaron los estudios ha disminuido.
El procedimiento indicado tambin vale cuando la poblacin
es pequea y la muestra se realiza con reposicin. Si la poblacin
es pequea y la muestra se toma sin restitucin, la regin de re-

139

chazo se determina con la distribucin binomial, tema que no se


aborda en el presente libro.

Pruebas de hiptesis en dos poblaciones normales:


medias, varianzas y proporciones
En muchos estudios, incluidos los educativos, es necesario comparar ciertas caractersticas en dos o ms grupos de sujetos. Tal
sera el caso, por ejemplo, si pensamos que un nuevo mtodo de
enseanza puede tener un porcentaje mayor de alumnos aprobados que otro mtodo de enseanza estndar, o cuando nos planteamos si los nios de las distintas comunidades rurales tienen o
no la misma altura.
La eleccin de un mtodo de anlisis apropiado en este caso
depender de la naturaleza de los datos y la forma en la que estos
hayan sido obtenidos. Fundamentalmente, cuando se comparan
dos o ms grupos de observaciones pueden darse dos tipos de
diseo: aquel en el que las observaciones se refieren a dos grupos
independientes de individuos, o el caso en el que cada serie de
datos se recoge en los mismos sujetos bajo condiciones diferentes.
El tipo de metodologa ser distinto segn el caso en el que nos
encontremos.
Otro aspecto a tener en consideracin ser el tipo y distribucin de la variable. Generalmente, los mtodos paramtricos requieren que las muestras de cada grupo provengan de
una distribucin aproximadamente normal con una variabilidad semejante, de modo que si los datos disponibles no verifican
tales condiciones, puede resultar til una transformacin de los
mismos (aplicacin del logaritmo, raz cuadrada, etc.) o, en todo
caso, se debera recurrir a la utilizacin de procedimientos no paramtricos.
Poblaciones independientes: igualdad de medias cuando se conocen las
varianzas poblacionales

140

Si X e Y son variables aleatorias independientes con distribucio-

2
nes N 1 , 1 y N 2 , 22 respectivamente; entonces, las medias

muestrales X 1 y X 2 , correspondientes a muestras de tamao


y

n2 ,

n1


2
1

y
tienen las siguientes distribuciones N 1 ,
n1

2
N 2 , 2 . Luego, la variable aleatoria X 1 - X 2 estandarizada,
n2

(X X 2 ) (1 2 ) , tiene distribucin N (0,1).


Z= 1
12 22
+

n1

n2

A continuacin se presentan los pasos a seguir para probar la


hiptesis nula respecto a la igualdad de medias (equivalente a que
la diferencia de medias es igual a cero), frente a la hiptesis alternativa que las medias son diferentes.
Paso 1: Se plantea H 0 : 1 = 2 versus H 0 : 1 2 .
Paso 2: Si se conocen las varianzas poblacionales y si la hiptesis
nula es verdadera; el valor de la estadstica de prueba basado en
los valores observados de las dos muestras independientes,
x11,...., x1n1 de la variable X 1 y x21,...., x2,n 2 de la variable X 2 es:

zc =

(x x )
1

2
+ 2 , donde x1 y x2 son los valores que toman
n1 n2
2
1

las medias de las muestras observadas.

Paso 3: Para = 0.05, P Z > zterico = 0.05 = , entonces

P ( Z < zterico ) = 0.95 , por lo que zterico = 1.96.

Luego, la regin de rechazo es el intervalo (- , -1.96) o el interva141

lo (1.96, ).
Paso 4: Si el valor del estadstico de prueba cae en uno de los intervalos de la regin de rechazo, entonces, se rechaza la hiptesis
nula.
A continuacin se presenta el resumen de las hiptesis contrastadas, la estadstica de prueba y la regla de decisin.
Ejemplo 3.9
En un sistema educativo se aplicaron dos mtodos A y B para ensear el curso de fsica. En un grupo de 80 estudiantes se aplic el
Hiptesis

Estadstica de prueba

Regla de decisin
Rechazar la hiptesis

H 0 : 1 = 2 , si
H 0 : 1 = 2
H1 : 1 > 2

H 0 : 1 = 2
H 1 : 1 < 2

zc =

zc =

(x x )
1

+
n1 n2
2
1

(x x )
1

zc > zterico

2
2

+
n1 n2
2
1

2
2

con el SPSS:

p _ value <

zc > zterico
con el SPSS:

p _ value <

H 0 : 1 = 2
H 1 : 1 2

zc =

(x x )
1

+
n1 n2
2
1

2
2

zc > zterico
equivalentemente

zc > zterico zc < zterico


con el SPSS:

p _ value < / 2

142

mtodo A y en el otro de 120 se aplic el mtodo B. Las medias de


las calificaciones obtenidas fueron 13 y 13.5 respectivamente. Podemos admitir que los mtodos de enseanza no son diferentes y
que las diferencias encontradas en las muestras se debe al azar?.
Experiencias anteriores dicen que las variables X 1 y X 2 que representan los rendimientos con los mtodos A y B respectivamente, tienen distribucin normal con varianzas 3 y 3.5 y = 0.05 .
Solucin
Paso 1: La hiptesis nula indica que no existe diferencia entre el
rendimiento promedio alcanzado aplicando con el mtodo A y el
rendimiento promedio alcanzado con el mtodo B; mientras que
la hiptesis alternativa dice que los rendimientos promedio son
diferentes. As:

H 0 : 1 = 2

H1 : 1 2

Paso 2: Con los valores de las medias muestras, los tamaos de


muestra y la informacin respecto a las varianzas se encuentra
que el valor del estadstico de prueba es -1.94.

zc =

(x x )
1

+
n1 n2
2
1

2
2

(13 13.5)
3 3.5
+
80 120

= -1.94.

Paso 3: Para = 0.05 , P ( Z > zterico ) = 0.05 = o

P ( Z < zterico ) = 0.95 , por lo que zterico = 1.96 .

Luego, la regin de rechazo es el intervalo (- , -1.96) el intervalo (1.96, ).


Paso 4: Como el valor del estadstico de prueba zc =-1.94 no cae
en el intervalo indicado, podemos decir que la diferencia encontrada entre las medias de las muestras, no es significativa al nivel
de significacin 0.05.

143

Poblaciones independientes: igualdad de medias cuando las varianzas


poblacionales son desconocidas e iguales
Si X e Y son variables aleatorias independientes con distribuciones N (1 , 2 ) y N (2 , 2 ) respectivamente; entonces, las medias
muestrales X 1 y X 2 , correspondientes a muestras de tamao

n1 y n2 , tienen las siguientes distribuciones N 1, y


n1
2
N 2 , . Luego, la variable aleatoria
n2

Z=

(X

X1

X 2 (1 2 ) , tiene distribucin

2
+
n1 n2
2

X 2 estandarizada

N (0,1) .

Como la varianza poblacional es desconocida, tiene que ser


estimada y en lugar de la variable estandarizada Z, se tiene la variable aleatoria:
t=

( X 1 X 2 ) (1 2 )
1
1
S +

n1 n2

, cuya distribucin es t-Student con

2
p

(n1 + n2 2 ) y se denota con t( n +n 2) . El estimador de la varian1

za poblacional es S p2 =

(n 1)S + (n 1)S
n +n 2
2
1

2
2

As, en lugar de la estadstica de prueba zc =

la estadstica de prueba tc =

( x1 x2 )
1
1
s 2p +

n1 n2

. s 2p =

(x x )
1

2 2
+
n1 n2

, se usa

(n 1)s + (n 1)s
n +n 2
2
1

2
2

es

la varianza combinada de las dos muestras, s12 y s22 son las estimaciones de las varianzas muestrales de tamaos n1 y n2 .
A continuacin se presenta el resumen de las hiptesis con144

trastadas, la estadstica de prueba y la regla de decisin.


Ejemplo 3.10
Un investigador en el campo educativo sostiene que el mdulo didctico empleado en la enseanza de Matemticas es uno
de los factores que influye y determina en el proceso de enseanza aprendizaje y por lo tanto, el mdulo adoptado incidir
Hiptesis

Estadstica de prueba

Regla de decisin
Rechazar la hiptesis
: u1 = u2 , si
0

H
H
H
H
H
H

: 1 = 2
: 1 > 2
1
0

: 1 = 2
: 1 < 2
1

1
1
s 2p +

n1 n2

: 1 = 2
: 1 2
1
0

con el SPSS:

p _ value <

( x1 x2 )

tc =

tc > tterico

( x1 x2 )

tc =

tc < tterico

1
1
s 2p +

n1 n2

con el SPSS:

p _ value <

tc > tterico

( x1 x2 )

tc =

1
1
s 2p +
n1 n2

equivalentemente

tc > tterico tc < tterico


con el SPSS:

p _ value <

H
Para H
Para H
Para

tterico = t(

1
1

(n n
: < , P(t(n n
: 1 > 2 , P t(
1

)
)= donde t

=t
t
) > tterico = donde terico ( n1+n2 2,1 )
) < tterico

terico

= t(

n1+n22,1 )

: 1 2 , P t( + 2 ) > tterico = / 2 donde


n n

n1+n2 2,1 / 2 )

tterico = t(

n1+n22,1 / 2 ) .

145

en el rendimiento acadmico de los estudiantes. Para verificar su


hiptesis decide realizar el siguiente experimento: durante un semestre se llev a cabo el trabajo lectivo en dos grupos independientes de estudiantes de la misma carrera en la misma universidad, empleando dos mdulos (A y B) de caractersticas bien diferenciadas, que fueron seleccionados aleatoriamente. Al final del
curso se aplic el mismo examen y se obtuvo las siguientes notas.
Suponiendo que las muestras provienen de poblaciones normales con varianzas iguales, los resultados encontrados por el
profesor apoyan la hiptesis de investigacin con nivel de significacin 0.10?.
Solucin
Mtodo A

15

16

15

13

13

16

16

Mtodo B

13

14

14

11

12

14

13

14

17

Paso 1: La hiptesis nula indica que no existe diferencia entre el


rendimiento promedio alcanzado aplicando con el mtodo A y el
rendimiento promedio alcanzado con el mtodo B; mientras que
la hiptesis alternativa dice que los rendimientos promedio son
diferentes. As:

H 0 : 1 = 2

H1 : 1 2

Paso 2 Se explica con detalle la obtencin de las media y varianzas de las muestras:
Suponiendo que las varianzas poblaciones son iguales se estima con:

146

s 2p =

(n 1)s + (n 1)s
n +n 2
2
1

2
2

(x

Notas de los
estudiantes
mtodo A

1i x1

8(2) + 6(1.333)
= 1.7141
14

Notas de los
estudiantes
mtodo B

x1i

0
1
0
4
4
1
1
1
4
16

x1 =

1 n1
135
= 15

x
1i =
n1 i =1
9

s12 =

1 n1

n1 1 i =1

s22 =

(x

1i x1

13
14
14
11
12
14
13
---91

tc =

0
1
1
4
1
1
0
8

n1 = 9
16
=2
8

1 n2
91
= 13

n21 i =1 x2i = 7
1 n2

n2 1 i =1

2i x2

x2 i

15
16
15
13
13
16
16
14
17
135

x2 =

(x

(x

2i x 2

( x1 x2 )
1
1
s 2p +

n1 n2

n2 = 7

8
= 1.333
7
15 13

1 1
1.7141 +
9 7

= 3.031.

Paso 3: Para = 0.10 P t(n +n 2 ) > tterico = , con 14 grados de libertad, tterico = t( n1+n 2 2,1 / 2 ) = t(14,0.975) = 1.761 tterico = t( n +n 2,1 / 2) = t(14,0.975) = -1.761.
Luego, la regin de rechazo es el intervalo (- , -1.761) el
intervalo (1.761, ).
1

147

Paso 4: Como el valor del estadstico de prueba tc = 3.031 cae


en el intervalo (1.761, ), podemos decir que la diferencia encontrada entre las medias muestrales es significativa al nivel de significacin 0.10.
Ejemplo 3.11

-1.76

1.76

Resolveremos el ejemplo 3.10 usando el auxilio del software estadstico SPSS.


Solucin
Paso 1: La hiptesis nula indica que no existe diferencia entre el
rendimiento promedio alcanzado aplicando con el mtodo A y el
rendimiento promedio alcanzado con el mtodo B; mientras que
en la hiptesis alternativa se postula que los rendimientos promedio son diferentes. As:

H 0 : 1 = 2

H1 : 1 2

Paso 2: Con el auxilio del SPSS, se ejecutan los siguientes comandos.


a)
b)

148

Activar el SPSS.
Abrir el archivo de DATOS2-mtodos. Podr observar que
tenemos valores de dos variables: de la variable rendimiento
de los estudiantes y de la variable grupo, donde se clasifica a
los estudiantes segn el mtodo de enseanza. En la variable
grupo, se ha codificado con 1 a quienes recibieron la ense-

c)

anza con el mtodo A y con el cdigo 2 a quienes estudiaron


con el mtodo B.
Ejecutar los siguientes comandos del SPSS que permitirn
encontrar el valor de que luego se comparar con el valor de
encontrado en la tabla t Student.
ANALIZE/COMPARE MEANS/ INDEPENDENT-SAMPLE
T-TEST/ llevar a TEST VARIABLE la variable creada RENDIMIENTO/ en GROUPING VARIABLE elegir GRUPO/ DEFINE GROUPS/ en grupo1 colocar 1 y en grupo2 colocar 2/
CONTINUE/ OK.
En el output del SPSS se tiene el valor de tc = 3.031.

Paso 3: p _ value debe compararse con

= 0.05 , pues si

p _ value / 2 < / 2 se rechaza la hiptesis nula.

Paso 4: Como el valor de p _ value = 0.009 es menor que < / 2 ,


la decisin es rechazar la hiptesis nula. Es decir, podemos decir

rendimiento

Equal variances
assumed

df

Sig. (2-tailed) =

3.031

14

.009

p _ value

que la diferencia encontrada entre las medias muestrales es significativa al nivel de significacin 0.10.
Poblaciones independientes: igualdad de medias cuando las varianzas
poblacionales son desconocidas y diferentes
Si X 1 e X 2 son variables aleatorias independientes con distribu-

ciones N 1 , 12 y N 2 , 22 respectivamente; entonces, las me-

149

dias muestrales

X 1 y X 2 , correspondientes a muestras de tama-

2
o n1 y n2 , tienen las siguientes distribuciones N 1 , 1 y
n1


N 2 , 2
n2

Si no se conocen las varianzas de las variables X 1 e X 2 , stas


1

n1

2
se estiman con s1 = n 1 x1i x1
i =1
1

estadstica de prueba es, tc =

)y
2

s22 =

( x1 x2 )
s12 s22
+

n1 n2

1 n2

n2 1 i =1

(x

2i x 2

) y la
2

. Los grados de libertad

s12 s22
n1 + n2

de la estadstica son k , donde: k =


2

s12
s22
n
n
2
1

+
n1 + 1
n2 + 1

2.

Si k 30 , el estadstico tc tiene distribucin aproximadamente normal y el procedimiento es similar al caso donde se conocen
las varianzas.
Si las muestras son suficientemente grande ( n1 30 y
n2 30 ) e independientes, para probar la hiptesis respecto a la
igualdad de medias, se usa como valor de la estadstica de prueba

z=

150

(x x ) , que corresponde a una variable cuya distribucin


1
2
1

s
s2
+ 2
n1 n2

es normal estndar.
Ejemplo 3. 12
Un investigador en el campo educativo sostiene que el mdulo didctico empleado en la enseanza de Matemticas es uno de los factores que influye y determina en el proceso de enseanza aprendizaje y por lo tanto, el mdulo adoptado incidir en el rendimiento
acadmico de los estudiantes. Para verificar su hiptesis decide
realizar el siguiente experimento: durante un semestre se llev a
cabo el trabajo lectivo para dos grupos de estudiantes de la misma carrera en la misma universidad, empleando dos mdulos (A
y B) de caractersticas bien diferenciadas. Al final del curso se aplica
Mtodo A

15

16

15

13

13

16

16

14

Mtodo

13

18

14

17

12

17

13

17

el mismo examen y se obtuvo las siguientes notas.


Suponiendo que las muestras provienen de poblaciones normales con varianzas diferentes. Los resultados encontrados por
el profesor apoyan la hiptesis de investigacin?. Use nivel de significacin 0.10.
Solucin
Paso 1: La hiptesis nula indica que no existe diferencia entre el
rendimiento promedio alcanzado aplicando el mtodo A y el rendimiento promedio alcanzado con el mtodo B; mientras que la
hiptesis alternativa dice que los rendimientos promedio son diferentes. As:

H 0 : 1 = 2

H1 : 1 2

Paso 2: Con el auxilio del SPSS, se ejecuta lo siguiente:

151

a)
b)
c)

Activar el SPSS.
Abrir el archivo de DATOS3-diferentes.
ANALIZE/COMPARE MEANS/ INDEPENDENT-SAMPLE
T-TEST/ llevar a TEST VARIABLE la variable creada RENDIMIENTO/ en GROUPING VARIABLE elegir GRUPO/
DEFINE GROUPS/ en grupo1 colocar 1 y en grupo2 colocar
2/ CONTINUE/ pulsar el comando OK.
En el output del SPSS se tiene directamente el valor de
F

Sig.

df

Sig.
(2-tailed)

p _ value
rendimiento

Equal
variances not
assumed

.139

9.151

.892

tc = 0.139 con 9 grados de libertad.


Slo con fines didcticos, vamos a ejecutar los comandos:
ANALIZE/COMPARE MEANS/ MEANS/ para DEPENDENT LIST elegir RENDIMIENTO y para INDEPENDENT LIST
elegir GRUPO/ elegir OPTIONS/ seleccionar VARIANCA/ CONTINUE/ OK.
grupo

Variance

1
2
Total

9
7
16

2.000
5.810
3.396

El output del SPSS nos muestra los siguientes resultados:


con los que comprobaremos el valor de los grados de libertad:

152

s12 s22
n1 + n2

k=
2

s12 s22
n n
1
2

+
n1 + 1
n2 + 1

[(2 9 )+ (5.81 7 )]
2

2 =

( 2 9 ) + (5.81 7 )

9 +1

2 = 9.15

7 +1

Paso 3: El valor de p _ value / 2 debe compararse con 2 = 0.025 ,


pues si p _ value < , se rechaza la hiptesis nula.
Paso 4: Como el valor de p _ value = 0.892 no es menor que <
= 0.10, la decisin es no rechazar la hiptesis nula. Es decir, podemos decir que no existe informacin suficiente para rechazar la
hiptesis nula con el nivel de significacin 0.10.
Poblaciones independientes: Pruebas de hiptesis para la diferencia de
proporciones 1 y 2
En las poblaciones 1 y 2, con respectivas proporciones poblacionales 1 y 2 ( de estudiantes, profesores, etc., para ser ms genricos, de "unidades"), con determinados atributos; se desea contrastar la hiptesis nula H 0 : 1 = 2 con cualquiera de las hiptesis alternativas: H 1 : 1 2 , H 1 : 1 > 2 H 1 : 1 < 2 .
Los parmetros que son las proporciones poblacionales tienen como estimadores en cada una de las muestras: P1 =

P2 =

A
y
n1

B
, donde es el nmero de elementos con el atributo de inn1

ters en la primera muestra y es el nmero de elementos con el


mismo atributo en la segunda muestra. Cuando las muestras son
( P1 P2 ) ( 1 2 )
suficientemente grandes, la estadstica
tiene
1 1
P (1 P ) +
n1 n2
distribucin aproximadamente normal, donde P =

n1P1 + n2 P2
.
n1 + n2

Si la hiptesis nula es verdadera, una estimacin comn de

153

Hiptesis

H 0 : 1 = 2
H1 : 1 > 2

H 0 : 1 = 2
H1 : 1 < 2

Estadstico de prueba

zc =

zc =

H 0 : 1 = 2 z =
c
H1 : 1 2

p1 p2
1 1
p (1 p ) +
n1 n2

p1 p2
1 1
p (1 p ) +
n1 n2

p1 p2
1 1
p (1 p ) +
n1 n2

Regla de decisin
Rechazar la hiptesis
H 0 : 1 = 2 , si

zc > zterico ( zterico , )


con el SPSS:

p _ value <

zc > zterico ( zterico , )


Con el SPSS:

p _ value <

zc > zterico
equivalentemente

zc > zterico zc < zterico


Con el SPSS:

p _ value <

1 = 2 = , es p =
dstica de prueba

n1 p1 + n2 p2
y se puede usar como la estan1 + n2
p1 p2

. A continuacin se presenta
1 1
p (1 p ) +
n1 n2
el resumen para cada una de las posibles hiptesis alternativas y
las respectivas regiones de rechazo.
Ejemplo 3.13
200 estudiantes fueron divididos aleatoriamente en dos grupos,
cada uno de 100. Los de la muestra 1 aprendieron determinado
material en el cual se enuncia verbalmente el concepto de transiti-

154

vidad, a continuacin de lo cual se dieron varios ejemplos de la


situacin. A los estudiantes del grupo 2 se les expuso ejemplos,
tras de lo cual se enunci verbalmente el concepto de transitividad. Son dos las poblaciones subyacentes a las muestras y que
hubieran podido participar en el experimento. Seguidamente se
administr una prueba de tems a los 200 estudiantes, para determinar si dominan el concepto de transitividad, pues, se desea saber si en estas dos poblaciones de estudiantes, las respectivas proporciones 1 y 2 que manejan la transitividad son o no iguales
(el criterio es el nmero de respuestas correctas en la prueba de
tems). Al finalizar el experimento, 68 estudiantes de la muestra 1
y 54 estudiantes de la muestra 2 dominaban el concepto de transitividad. Veamos si existe diferencia en las proporciones poblacionales. Usemos = 0.05 .
Solucin

1 : proporcin de estudiantes de la poblacin 1 que manejan el

concepto de transitividad. Se enunci el concepto y luego los


ejemplos.
2 : proporcin de estudiantes de la poblacin 2 que manejan el
concepto de transitividad. Se enunci primero los ejemplos y
luego el concepto.
p1 : proporcin de estudiantes de la muestra observada que manejan el concepto de transitividad, habiendo estudiado primero el concepto y luego los ejemplos.
:
p2 proporcin de estudiantes de la muestra observada que manejan el concepto de transitividad, habiendo estudiado primero los ejemplos y luego el concepto.

p1 =

B 54
A 68
=
= 0.68 y p2 = =
= 0.54
n1 100
n1 100
p=

100(0.68) + 100(0.54)
= 0.61
200

Paso 1: La hiptesis nula indica que no existe diferencia entre las


proporciones poblacionales de los estudiantes que aprendieron el
155

concepto de transitividad con los dos mtodos ya descritos.

H 0 : 1 = 2

H 0 : 1 2

Paso 2: Obtenemos el valor del estadstico de prueba:

zc =

p1 p2
1 1
p (1 p ) +
n1 n2

0.68 0.54
1
1
0.61(0.39)
+
100 100

0.14
=2.03
0.06897

Paso 3: Para =0.05, P ( Z > zterico ) = 0.05 = o P ( Z < zterico ) = 0.95 .


En la tabla normal estndar el el valor de la abcisa que cumple
con la condicin es zterico =1.96.
Luego, la regin de rechazo es el intervalo (- , -1.96) el
intervalo (1.96, ).
Paso 4: Como el valor de zc = 2.03 cae en el intervalo (1.96, ),
podemos decir que la diferencia encontrada entre las proporciones muestrales es significativa al nivel de significacin 0.05. Podemos concluir, que si se enuncia el concepto en primer trmino y a
continuacin se presentan los ejemplos, se obtiene mejor rendimiento que si la exposicin se hiciera en orden inverso.
Poblaciones independientes: Pruebas de hiptesis para el cociente de
varianzas
Cuando probamos las hiptesis con respecto a la igualdad de medias de dos poblaciones normales independientes, en el primer
caso se supone que las varianzas poblacionales eran conocidas.
Trabajando rigurosamente, ese supuesto debi ser justificado. El
procedimiento a seguir para esta prueba es el siguiente.
Si X 1 e X 2 son variables aleatorias independientes con distribuciones N (1 , 12 ) y N 2 , 22 respectivamente; se trata de pro-

12
= 1)
22
frente a la hiptesis alternativa H 0 : 12 22 . Cuando la hipte-

bar la hiptesis nula H 0 : 12 = 22 (equivalentemente H 0 :

156

sis nula es verdadera, la estadstica F =

S12
tienen distribucin
S22

F-Snedecor con (n1 1)y (n2 1) grados de libertad.

La estadstica de prueba basada en los valores observados de


dos muestras independientes, x11 ,...., x1n1 de la variable X 1 y
Hiptesis

Estadstico de prueba

H1 :
2
1

Fc > F( n 1,n 1;1

s12
Fc = 2
s2

H 0 : 12 = 22
2
2

Regla de decisin
Rechazar la hiptesis
H 0 : 12 = 22 , si

2)

Fc > F( n 1,n 1;1

2
x21,...., x2,n 2 de la variable X 2 respectivamente, es: F c= s12 , que
s2

se comparar con el valor terico de la abscisa de la distribucin F

con (n1 1) y (n2 1) grados de libertad.


Se rechaza la hiptesis nula, si el valor de la estadstica calculada se encuentra ya sea en la cola inferior o en la cola superior
correspondiente a , de la distribucin F-Snedecor, con (n1 1)
2
y (n2 1) grados de libertad.
Ejemplo 3.14
Un investigador en el campo educativo sostiene que el mdulo
didctico empleado en la enseanza de Matemticas es uno de los
factores que influye y determina en el proceso de enseanza aprenMtodo A

15

16

15

13

13

16

16

Mtodo B

13

14

14

11

12

14

13

14

17

dizaje y por lo tanto, el mdulo adoptado incidir en el rendimiento


acadmico de los estudiantes. Para verificar su hiptesis decidi
realizar el siguiente experimento: durante un semestre llev a cabo
el trabajo lectivo para dos grupos de estudiantes de la misma carrera en la misma universidad, empleando dos mdulos (A y B)
157

de caractersticas bien diferenciadas. Al final del curso aplic el


mismo examen a todos los estudiantes y obtuvo las siguientes notas.
Se puede decir que existe diferencia en la variabilidad de los
rendimientos empleando los mdulos A y B?. Supongamos normalidad en la distribucin de las variables consideradas y usemos el nivel de significacin 0.20.
Solucin
Observamos que los datos corresponden al problema 3.10, por lo
que, donde sea necesario, usaremos los resultados ya encontrados.
Paso 1: La hiptesis nula indicar que no existe diferencia entre
las varianzas de las dos poblaciones:

H 0 : 12 = 22 H1 : 12 22
Paso 2: Para obtener el valor de la estadstica de prueba, tomamos
del ejemplo 3.10 los valores de los tamaos de muestra n1 = 9 ,
n2 = 7 y los valores de las varianzas muestrales:
s12 =

1 n2

n1 1 i =1

(x

1i x1

) = 168 = 2
2

2
y s2 =

1 n2

n2 1 i =1

(x

2i x 2

8
= 1.333 . Luego, obtenemos el valor de la estadstica de prueba:
7
s2
2
f c = 12 =
= 1.5
s2 1.33

Paso 3: Para =0.02 P F(n1 1,n2 1) > f terico = 0.01 = / 2 . Si en el paso


2, siempre elegimos como numerador la mayor varianza, slo se

analiza P F(n1 1,n2 1) > f terico = / 2 y la regin crtica se reduce


al intervalo ( f terico , ).
En el presente problema, los grados de libertad son 8 y 6 respectivamente, entonces para P F(8,6 ) > f terico = 0.10 tenemos

158

f terico = 8.1, por lo que la regin crtica es el intervalo (8.1, ).


Paso 4: Como el valor del estadstico de prueba f c =1.5 no cae en
el intervalo (8.1, ), podemos decir que la diferencia encontrada
entre las proporciones muestrales no es significativa al nivel de
significacin 0.02. Podemos concluir, que fue razonable el supuesto
considerado en el ejemplo 3.11 respecto a las varianzas poblacionales.

Ejercicios
Usted es un inspector de escuelas pblicas y realiza un experimento para investigar si la habilidad de lectura de estudiantes de
primer ao de secundaria ha mejorado o no. En una muestra aleatoria de 185 estudiantes de esta poblacin encuentra una habilidad media de lectura igual a 75 palabras por minuto. Las notas
nacionales sobre la habilidad de lectura, para los estudiantes del
primer ao de secundaria, muestran una distribucin normal con
media 80 palabras por minuto y una desviacin estndar igual a
12. Todo puntaje por debajo de 80 se considera deficiente. Es razonable considerar que la habilidad de lectura de los estudiantes
de quinto de secundaria es deficiente?. Suponga normalidad y
= 0.10. Use la metodologa correspondiente para dar respuesta a
la pregunta planteada.
El Director Acadmico del centro pre universitario de la
UFV tiene la percepcin de que el rendimiento acadmico durante el primer ao de estudios en la universidad, de los alumnos ingresantes a travs de la institucin que dirige ha sufrido
cambios en los ltimos aos. Sabe que histricamente los alumnos han tenido un rendimiento promedio de 14 puntos. Para confirmar su percepcin llev a cabo un estudio, para el que escogi
una muestra aleatoria de 150 alumnos que ingresaron el ao 2004
a travs del centro pre universitario y pidi al sistema de matrcula el rendimiento de cada uno de estos alumnos durante el ao
acadmico 2004. Para dicha muestra obtuvo de rendimiento pro-

159

medio 14.5 puntos con desviacin estndar 0.5 puntos. Existe evidencia muestral para decir si es cierta la percepcin del Director
Acadmico?. Suponga normalidad y = 0.10. Use la metodologa
correspondiente para dar respuesta a la pregunta planteada.
en mnibus

caminando

x1 = 145

x2 = 135

Para determinar el efecto sobre el desarrollo psicolgico de


los escolares que tienen que viajar a la escuela en mnibus de servicio pblico, se tom una prueba de ansiedad a un grupo de 40
escolares que usan este sistema de transporte y a 30 escolares que
van caminando al colegio. Se sabe que las desviaciones estndar
en ambas poblaciones son 9 y 12 respectivamente.
Los resultados de la prueba de ansiedad son los siguientes:
Suponiendo normalidad, se puede concluir que efectivamente el uso del mnibus aumenta la ansiedad en los escolares?. Use
= 0.05.
Usted es un inspector de escuelas pblicas y realiza un experimento para investigar si la habilidad de lectura de estudiantes
de segundo ao de secundaria ha mejorado. En una muestra aleatoria de 95 estudiantes de esta poblacin encuentra una habilidad
media de lectura igual a 80 palabras por minuto. Las notas nacionales sobre la habilidad de lectura, para los estudiantes del segundo ao de secundaria, muestran una distribucin normal con
media 78 palabras por minuto y una desviacin estndar igual a
10. Es razonable considerar que la habilidad de lectura de los estudiantes de quinto de secundaria ha mejorado?. Use = 0.10.
El Director Acadmico del centro pre universitario de la
UFV tiene la percepcin de que el rendimiento acadmico durante el primer ao de estudios en la universidad, de los alumnos ingresantes a travs de la institucin que dirige mejora ao a
ao. Sabe que histricamente los alumnos de primer ao han teni-

160

do un rendimiento promedio de 13 puntos. Para confirmar su percepcin llev a cabo un estudio, para el que escogi una muestra
aleatoria de 25 alumnos que ingresaron el ao 2004 a travs del
centro pre universitario que dirige y pidi al sistema de matrcula
el rendimiento de cada uno de estos alumnos durante el ao acadmico 2004. Para dicha muestra obtuvo un rendimiento promedio de 13.9 puntos con desviacin estndar 0.45 puntos. Existe
suficiente evidencia muestral para decir que es cierta la percepcin del Director Acadmico?. Suponga normalidad y use = 0.10
Antes de aplicar el Plan Huascarn en el distrito de Cajatambo, el rendimiento promedio de los estudiantes de primer ao de
primaria era de 12 puntos. Para determinar si el Plan ha sido efectivo en el incremento del rendimiento de los estudiantes, se observaron al azar a 150 estudiantes despus de aplicar el plan durante
un ao acadmico, obtenindose de rendimiento promedio 13.5
puntos con desviacin estndar 2.1 puntos. Al nivel de significacin 0.05 se podra decir que existe evidencia de el rendimiento
promedio ha aumentado?. Use la metodologa correspondiente
para dar respuesta a la pregunta planteada y de ser necesario suponga normalidad.
Hace tres aos el Ministro de Educacin afirm que histricamente la tasa de desercin estudiantil en el nivel primario es
del 20%. En los ltimos dos aos el gobierno ha realizado programas especiales para que dicha tasa disminuya sustancialemte. La
informacin del ao pasado seala que la tasa de desercin fue
del 17%. Qu puede decirse de la afirmacin del Ministro de Educacin?. De ser necesario suponga normalidad y use a) = 0.05
b) Use = 0.10.
Un investigador en el campo educativo sostiene que el mdulo
didctico empleado en la enseanza de Matemticas es uno de los
factores que influye y determina en el proceso de enseanza aprendizaje y por lo tanto, el mdulo adoptado incidir en el rendimiento
Mtodo A

12

13

12

10

10

13

13

11

14

Mtodo B

16

17

117

14

15

17

16

16

15

161

acadmico de los estudiantes. Para verificar su hiptesis decide realizar el siguiente experimento: durante un semestre se llev a cabo
el trabajo lectivo para dos grupos de estudiantes de la misma carrera en la misma universidad, empleando dos mdulos (A y B)
de caractersticas bien diferenciadas. Al final del curso se aplica el
mismo examen y se obtuvo las siguientes notas:
Suponiendo que las muestras provienen de poblaciones
normales con varianzas iguales, los resultados encontrados
por el profesor apoyan la hiptesis de investigacin?. Suponga normalidad de las variables consideradas y use nivel de significacin 0.10.
Un grupo de 350 estudiantes fueron divididos aleatoriamente en dos subgrupos de 100 y 150 estudiantes. Los de la muestra 1
aprendieron determinado material en el cual se enuncia verbalmente el concepto de transitivitas de "ms alto que", a continuacin de lo cual se dieron varios ejemplos de la situacin; a los estudiantes del grupo 2 se les expuso ejemplos tras de lo cual se
enunci verbalmente el concepto. Son dos poblaciones, subyacentes a las muestras y que hubieran podido participar en el experimento. Seguidamente se administr una prueba para determinar
si dominan el concepto de transitividad, pues, se desea saber si en
estas dos poblaciones de estudiantes, las respectivas proporciones 1 y 2 que manejan la transitividad son o no iguales (el criterio es el nmero de respuestas correctas en la prueba de tems). Al
finalizar el experimento, 62 estudiantes de la muestra 1 y 70 estudiantes de la muestra 2 dominaban el concepto de transitividad.
Existe diferencia en las proporciones poblacionales. Use = 0.05.
En una investigacin conducida por una estudiante del doctorado en Educacin las poblaciones fueron las siguientes: los estudiantes del tercer grado de primaria de colegios estatales, cuyas
edades fluctuaban entre 8 aos y 12 aos de edad, residentes en el
Cercado del Distrito del Callao, pertenecientes al estrato socioeconmico bajo, y los estudiantes del tercer grado de primaria de colegios particulares, cuyas edades fluctuaban entre 8 aos y 12 aos

162

de edad, residentes en el Cercado del Distrito del Callao, pertenecientes al estrato socioeconmico medio.
Por el costo de la investigacin, es decir, por razones econmicas, administrativas y algo de dispersin geogrfica se consider conveniente trabajar con dos muestras aleatorias independientes, una de cada una de las poblaciones ya descritas.
Las variables investigadas fueron los puntajes en las siguientes pruebas:
Nivel de p. anlisis fonmico (PAF)
Nivel socio
econmico
BAJO

MEDIO

Variables
PAF

PCF

TEDE

PCL

MEDIA
DESVIACIN
ESTNDAR
TAMAO
MUESTRA

25.1

48.9

67.7

12.5

5.7

6.9

5.5

2.9

15

15

15

15

MEDIA
DESVIACIN
ESTNDAR
TAMAO
MUESTRA

27.5

56.5

91.1

15.4

3.1

6.9

5.5

3.2

18

18

18

18

Niveles de decodificacin lectora (TEDE)


Niveles de comprensin lectora (PCL)
Nivel de p. con. fon' (PCF)
Los resultados descriptivos de la investigacin fueron los siguientes:

a)

b)

Suponiendo normalidad se puede concluir que efectivamente:


La media de los puntajes en el nivel de P. Anlisis Fonmico
(PAF) es superior en el estrato medio con respeto al estrato
bajo?. Use = 0.10.
La media de los puntajes en el nivel de Decodificacin Lectora (TEDE) es superior en el estrato medio con respeto al estrato bajo?. Use = 0.10.

163

c)

d)

La media de los puntajes en el nivel de Comprensin Lectora


(PCL) es superior en el estrato medio con respeto al estrato
bajo?. Use = 0.10.
La media de los puntajes en el nivel de P.Con.Fon' (PCF) es

Nivel socio
econmico
BAJO

MEDIO

Variables
PAF

PCF

TEDE

PCL

MEDIA
DESVIACIN
ESTNDAR
TAMAO
MUESTRA

25.1333

58.8333

3.5

3.0

5.1

3.0

35

35

35

35

MEDIA
DESVIACIN
ESTNDAR
TAMAO
MUESTRA

29.5333

65.3667

3.5

3.4

5.0

3.5

40

40

40

40

97.7000 14.3000

102.2667 16.0333

superior en el estrato medio con respeto al estrato bajo?. Use


= 0.10.
Para la misma investigacin descrita en el ejercicio 3.3, los resultados de otras dos muestras independientes fueron las siguientes:

a)

b)

c)

164

Suponiendo normalidad se puede concluir que efectivamente:


La media de los puntajes en el nivel de P. Anlisis Fontico
(PAF) es superior en el estrato medio con respeto al estrato
bajo?. Use = 0.10.
La media de los puntajes en el nivel de Decodificacin Lectora (TEDE) es superior en el estrato medio con respeto al estrato bajo?. Use = 0.10.
La media de los puntajes en el nivel de Comprensin lectora
(PCL) es superior en el estrato medio con respeto al estrato
bajo?. Use = 0.10.

d)

La media de los puntajes en el nivel de P.Con.Fon' (PCF) es


superior en el estrato medio con respeto al estrato bajo?. Use
= 0.10.

En los ejercicios 3.10 y 3.11 haga las correspondientes pruebas de hiptesis para comparar las varianzas poblacionales en cada
uno de los casos. Use = 0.10. Si su decisin es contraria al supuesto que plante con respecto a las varianzas, en cada uno de
los ejercicios, a la luz de los resultados vuelva a resolverlos.
En una investigacin realizada por una estudiante del doctorado en Educacin, la Poblacin objetivo fueron los alumnos matriculados en las diferentes sedes del programa de Formacin Docente Semi-escolarizado y autofinanciado de la Universidad Nacional Faustino Snchez Carrin de Huacho, y que en 1997 fueron
un total de 1500 alumnos.
Por razones econmicas, administrativas y de dispersin geogrfica se consider como poblacin muestreada (objeto de la presente investigacin) las sedes de Barranca, Huacho y Huaral.
Las variables estudiadas fueron:
Rendimiento en la prueba de comprensin lectora.
Notas
Sede
Huacho
Barranca
Huaral
Total

nmero
alumnos

desviacin
estndar

media
muestral

18
7
5

2.80
1.68
1.29

12.0
13.5
13.0

30

Rendimiento promedio en cursos de humanidades.


Rendimiento promedio en cursos de ciencias.
A continuacin se presentan los resultados de la prueba de
comprensin lectora aplicada a las muestras aleatorias obtenidas
de cada una de las sedes:

165

Suponiendo normalidad, se puede concluir con un nivel de


significacin:
a)

b)

c)

El rendimiento promedio de los estudiantes de la sede de


Huacho es igual al rendimiento promedio de los estudiantes
de la sede de Barranca?.
El rendimiento promedio de los estudiantes de la sede de
Huaral es igual al rendimiento promedio de los estudiantes
de la sede de Barranca?.
El rendimiento promedio de los estudiantes de la sede de
Huacho es igual al rendimiento promedio de los estudiantes
de la sede de Huaral?.

En una investigacin realizada por una estudiante del doctorado en Educacin, la Poblacin objetivo fueron los alumnos matriculados en las diferentes sedes del programa de Formacin Docente Semi-escolarizado y autofinanciado de la Universidad Nacional Faustino Snchez Carrin de Huacho, y que en 1997 fueron
un total de 1500 alumnos.
Por razones econmicas, administrativas y de dispersin geogrfica se consider como poblacin muestreada (objeto de la presente investigacin) las sedes de Cajatambo, Churn y Copa. Las
variables estudiadas fueron:
Rendimiento en la prueba de comprensin lectora.
Notas
Sede
Cajatambo
Churn
Copa
Total

166

nmero
alumnos

desviacin
estndar

media
muestral

60
35
45

4.80
2.68
2.68

11.0
10.5
13.0

140

Rendimiento promedio en cursos de humanidades.


Rendimiento promedio en cursos de ciencias.
A continuacin se presentan los resultados de la prueba de
comprensin lectora aplicada a las muestras aleatorias obtenidas
de cada una de las sedes.
Suponiendo normalidad, se puede concluir con un nivel de
significacin:
a)

b)

c)

El rendimiento promedio de los estudiantes de la sede de


Cajatambo es igual al rendimiento promedio de los estudiantes de la sede de Churn?.
El rendimiento promedio de los estudiantes de la sede de
Cajatambo es igual al rendimiento promedio de los estudiantes de la sede de Copa?.
El rendimiento promedio de los estudiantes de la sede de
Churn es igual al rendimiento promedio de los estudiantes
de la sede de Copa?.

En los ejercicios 3.13 y 3.14 haga las correspondientes pruebas de hiptesis para comparar las varianzas poblacionales en cada
uno de los casos. Use Si su decisin es contraria al supuesto que
plante con respecto a las varianzas, en cada uno de los ejercicios,
a la luz de los resultados vuelva a resolverlos.

167

You might also like