You are on page 1of 33

Captulo II

Estimacin de parmetros

Estimacin puntual de parmetros

Explicaremos el tpico de la estimacin puntual de parmetros,


usando el siguiente ejemplo.
La Tabla N 2.1 contiene informacin de los salarios anuales
y participacin en un curso de gerencia educativa, de una mues-
tra aleatoria de directores de colegios privados.

Tabla N 2.1: Salario anual y participacin en el curso de gerencia


educativa de una muestra aleatoria de 30 directores de colegios privados

Salario anual Asisti al curso Salario anual Asisti al curso


( soles) ( soles)

9818,86 S 10353,20 S
10652,78 S 10508,26 No
9928,70 S 8996,00 S
9978,98 S 10386,52 S
9524,32 No 10594,60 S
11184,80 S 9024,18 S
9818,46 S 10350,60 S
10280,88 S 10878,36 No
10191,54 S 10032,84 No
11021,94 S 10594,72 No
9184,52 S 10048,26 No
11453,68 No 10558,78 No
11137,76 S 10195,88 S
10312,94 No 11172,18 S
11237,64 No 11461,82 No

[73] 71
Se utiliza la notacin x1 , x2 , etc., para indicar el salario anual
del primer director, del segundo, y as sucesivamente.
Por ejemplo, para estimar , la media de la poblacin del sa-
lario anual de los directores y, , la desviacin estndar del sala-
rio anual de los directores, se toman los datos de la Tabla N 2.1
para calcular los valores de los correspondientes estadsticos: la
media de la muestra X y la desviacin estndar de la muestra S.
As, tenemos que en la muestra observada, la media del salario
anual de los directores es:

x=
xi
=
310884
= 10362.80 ,
n 30
y la desviacin estndar:

s=
(x x ) =
i 448288.6381
= 669.54
n 1 29

Por otro lado, si en dicha muestra se calcula la proporcin de


los directores que asistieron al curso de gerencia educativa, pode-
mos estimar la proporcin de directores en la poblacin, , que
terminaron el curso de gerencia educativa. La tabla N 2.1 indica
que 19 de los 30 directores de la muestra terminaron el curso, en-
tonces la proporcin en la muestra, representada por p, es:
19
p= = 0,63 ; que se usa para estimar el parmetro de la
30
poblacin.

Al hacer los clculos anteriores hemos efectuado el procedi-


miento estadstico denominado estimacin puntual. Usamos los
datos de la muestra para calcular un valor de un estadstico de la
muestra que sirva como estimacin de un parmetro de la pobla-
cin.
En la notacin de la estimacin puntual, se dice que X es el
estimador puntual de la media poblacional , S es el estimador
puntual de la desviacin estndar poblacional , y que P es el es-
timador puntual de la proporcin poblacional. A los valores nu-

72
mricos de X , S o P, obtenidos en una determinada muestra se
les llaman estimaciones puntuales del parmetro y los hemos de-
notado con: X , s, p.
A continuacin y para cualquier otro caso se resume la nota-
cin:

Parmetros Estimadores Estimacin


(Funciones)

: Promedio o media X : Promedio o media Valor numrico


poblacional muestral obtenido para X

x= x i

: Proporcin poblacional P: Proporcin muestral p: valor numrico de


la proporcin muestra

(x x )
2
i
s=
: Desviacin estndar S: Desviacin n 1
poblacional estndar muestral valor de la desviacin
estndar

X 1 , X 2 , X n , es una muestra aleatoria desde la poblacin


donde la variable aleatoria X tiene esperanza E (X ) = , y varian-
za 2 = E (X )2 ; x1 , x2 , , xn son valores observados de la
muestra aleatoria.
As, para la muestra de 30 directores, la estimacin puntual
de es de x = 10362.80 soles, la de es de 669.54 soles y la de P
es 0.63. La Tabla N 2.2 contiene un resumen de los resultados de
la muestra y compara las estimaciones puntuales con los valores
reales de los parmetros de la poblacin.
Como se observa a continuacin, ninguna de las estimacio-
nes puntuales son exactamente iguales a los parmetros poblacio-
nales correspondientes. Se esperaba esta variacin porque se est
usando slo una muestra y no la informacin de toda la poblacin
para obtener la estimacin.

73
Tabla N 2.2: Resumen de estimaciones puntuales obtenidas a partir de una
muestra Aleatoria simple de 30 directores de colegios

Parmetro de la Valor del parmetro Estimador Estimacin


poblacin (en soles) puntual
puntual

: Promedio poblacional 11 000 X : Promedio x = 10 362.8


del salario anual muestral del
salario anual

: Desviacin estndar 700 S: Desviacin s = 669.54


poblacional del salario estndar muestral
anual del salario anual

: Proporcin poblacional 0.60 P: Proporcin muestral p = 0.63


de directores que de directores que
terminaron el curso terminaron el curso

Error de muestreo. El valor absoluto de la diferencia entre


estimador insesgado y el parmetro poblacional correspondiente
se llama error de muestreo. Para la media muestral, la desviacin
estndar y la proporcin muestral, los errores de muestreo son
X , S y P , respectivamente. Por tanto, para la mues-
tra de directores de colegios, los errores de muestreo son
x = 10362.80 11000 = 637.20 soles, s = 669.5 700 = 30.46
soles para la desviacin estndar muestral y
P = 0.63 0.60 = 0.03 para la proporcin muestral.
En este caso pudimos calcular los errores de muestreo por-
que hemos supuesto que conocemos los parmetros poblaciona-
les. Sin embargo, en una aplicacin real de muestreo no podemos
calcular de manera exacta el error de muestreo, porque no se co-
noce el valor del parmetro poblacional.

Propiedades de los estimadores puntuales

En la seccin anterior hemos mostrado cmo se pueden usar las


estadsticas o estimadores: la media de la muestra X , la desvia-
cin estndar muestral S y la proporcin muestral P como estima-

74
dores puntuales de sus correspondientes parmetros poblaciona-
les, , y . Resulta intuitivamente atractivo que cada uno de
esos estadsticos de muestra sea estimador puntual de su parme-
tro poblacional correspondiente. Sin embargo, antes de emplear
algn estadstico de muestra como estimador puntual, se debe
comprobar si tiene ciertas propiedades asociadas con los buenos
estimadores puntuales. En esta seccin describiremos de manera
sucinta algunas propiedades de los buenos estimadores puntua-
les: insesgamiento, eficiencia y consistencia.
En vista que se pueden emplear diversas estadsticas como
estimadores puntuales de distintos parmetros poblacionales, en
esta seccin usaremos la siguiente notacin general:

: parmetro poblacional de inters


: estadstico de muestra o estimador puntual de .

La notacin es la letra griega theta, y la notacin se llama


"theta sombrero". En general, representa cualquier parmetro
de la poblacin, como por ejemplo la media poblacional, la des-
viacin estndar poblacional, la proporcin poblacional, etc.,
representa la estadstica o estimador correspondiente, como la
media muestral, la desviacin estndar muestral y la proporcin
muestral.

Estimador insesgado

Si el valor esperado de la estadstica es igual al parmetro pobla-


cional que se estima, se dice que esa estadstica es un estimador
insesgado del parmetro poblacional.
La estadstica es un estimador insesgado del parmetro
poblacional , si:
()
E = ,
()
donde E es el valor esperado de la estadstica .

Al describir las distribuciones muestrales de la media y la


( )
proporcin muestrales, dijimos que E X = y E (P ) = . Enton-

75
ces, tantoX como P son estimadores insesgados de sus par-
metros poblacionales correspondientes, y . Tambin se pue-
2
( )
de desmostrar que E S = , es decir, S 2 es un estimador inses-
2

(X )
2
X
gado de la varianza poblacional 2 , donde S 2 = i
y
n 1
X =
Xi .
n

Estimador eficiente

Suponga que en una muestra aleatoria simple de n elementos se


tiene dos estimadores puntuales insesgados, 1 y 2 del mismo
parmetro poblacional , entonces, preferiremos usar el esti-
mador puntual con la menor desviacin estndar, porque tiende
a proporcionar una estimacin ms cercanas al parmetro pobla-
cional.

() ( ) () ( )
Si E 1 = E 2 = y Var 1 < Var 2 1 es ms efi-
ciente que 2 . Se dice que 1 es un estimador puntual insesgado
con menor desviacin estndar y tiene mayor eficiencia relativa
que el estimador 2 .

Estimador consistente

Una tercera propiedad asociada con los buenos estimadores pun-


tuales es la consistencia. Hablando en trminos generales, un esti-
mador puntual es consistente si sus valores tienden a acercarse al
parmetro de la poblacin conforme se incrementa el tamao de
la muestra. En otras palabras, un tamao de muestra grande tien-
de a proporcionar un mejor estimador puntual que un tamao

pequeo. Observe que en el captulo anterior se vio que la desvia-



cin estndar de la media muestral X , fue X = . Como X
n
se relaciona con el tamao de la muestra, de tal manera que las

76
muestras mayores dan menores valores de X , llegamos a la con-
clusin que un tamao de muestra mayor tiende a producir esti-
maciones puntuales ms cercanas a la media de la poblacin . En
este sentido, se dice que la media muestral, X , es un estimador
consistente de la media poblacional . Con el mismo razonamien-
to podemos llegar a la conclusin que la proporcin muestral P es
un estimador consistente de la proporcin poblacional y S es un
estimador consistente de .

Estimacin por intervalos en poblacones normales

Introduccin

Aunque X es un buen estimador puntual de , es obvio sealar


que hay una discrepancia (error) entre X y ,; entonces para con-
fiar en X como estimador de , se debe conocer el error e = X
y el riesgo de error; vale decir hay que encontrar la precisin del
estimador.
En este caso, la explicacin para los estimadores se refiere a
los estimadores puntuales y el concepto se denomina estimacin
puntual; es decir, dado un parmetro, por ejemplo , se estima
con un valor de X , x . Una deficiencia de los estimadores puntua-
les es que no estn vinculados a un juicio de probabilidad y que no
se puede establecer la probabilidad que hay de que X sea igual a .
Otra manera de estimar , es que ste se encuentre entre dos
valores a y b, a lo que se llama estimacin por intervalo.
Por ejemplo, se dir que la calificacin media de las notas del
curso de estadstica est entre 15 y 18 puntos, de modo que
15 18 .
La estimacin por intervalos consiste en atribuir al parme-
tro que se desee estimar no un valor concreto sino un rango de
valores entre los que se espera que puede encontrarse el verdade-
ro valor del parmetro con una probabilidad alta y conocida.
El rango de valores entre los cuales con determinada proba-
bilidad se encuentra el parmetro, se denomina intervalo confi-

77
dencial y tiene por limites confidenciales a los valores LI (Lmite
Inferior) y LS (Lmite Superior).
Se llama nivel de confianza (1 ) a la probabilidad que el
intervalo construido incluya el verdadero valor del parmetro, por
ejemplo a .
Para construir intervalos de confianza, necesitamos saber la
distribucin terica de la estadstica utilizada como estimador.
Conocida esta distribucin podemos conocer la probabilidad aso-
ciada a cada uno de sus valores.
A continuacin presentaremos la metodologa para encontrar
los intervalos de confianza para algunos parmetros.

Intervalos de confianza para la media con varianza conocida

Consideremos una poblacin con distribucin normal donde est


definida una variable aleatoria X con media desconocida y va-
rianza 2 conocida, cuya notacin es N (0,1). Encontraremos un
intervalo de confianza para la media poblacional .
En el captulo anterior hemos visto, que para una muestra alea-
toria, X 1 ,..., X n , tomada de la poblacin anterior, la variable alea-
toria media muestra, X , se distribuye normalmente con media
2 X
y varianza . Por tanto, la variable estandarizada Z = se
n / n
distribuye N (0,1).
Para > 0, es posible hallar el percentil z de la distribu-
(1 )
2
cin normal, para el cual:
P( z(1 / 2 ) Z z(1 / 2 ) ) = 1 . Luego se tiene que:

X
z(1 / 2 ) z(1 / 2 ) .
/ n
As, el intervalo para con un nivel de confianza (1 ) es:

X z(1 / 2 ) X + z(1 / 2 ) .
n n

78
Luego, un intervalo de confianza al nivel (1 ) , para la
media poblacional , cuando ya se observ la muestra de ta-
mao n es:


2 2
z(1 )
z(1 )
2 2


x z(1 / 2 ) x + z1( / 2 ) , (2.1)
n n

Por ejemplo, al nivel de confianza del 95% ( = 0,05 ), un in-


tervalo de confianza para es:

x 1.96 x + 1.96 .
n n
Al nivel de confianza del 99% ( = 0,01 ), el intervalo de con-
fianza para es:

x 2.58 x + 2.58
n n
Observemos que cuando se observa la muestra los estimado-
res se reemplazan por las respectivas estimaciones.

Ejemplo 2.1

Una muestra aleatoria de 100 estudiantes de Administracin Edu-


cativa respondi a una prueba de inteligencia espacial. En esa
muestra se obtuvo una media de 80 puntos y se conoci que en la
poblacin la desviacin tpica era 1 punto. Obtendremos un inter-
valo de confianza para hallar la verdadera inteligencia espacial

79
media de los estudiantes de Administracin Educativa, con un
nivel de confianza de 0.99.

Solucin

Para = 0.01 , en la tabla normal se obtiene z(1 / 2 ) = zterico = 2.58.


Se sabe que = 1 y x = 80 .
Reemplazando en (2.1) tenemos:

x 2.58 x + 2.58
n n

80 2.58
(1) 80 + 2.58
(1)
100 100
80 0.258 80 + 0.258
79.74 80.26

Luego, la verdadera inteligencia espacial media de los estu-


diantes de Administracin Educativa se encontrar entre 79.74 y
80.26, con un nivel de confianza del 99%.

Intervalo de confianza para la media poblacional cuando la varianza es


desconocida(muestras pequeas)

En poblaciones normales con varianza desconocida, el intervalo


para estimar , al nivel de confianza de (1 ) , es:
S S
X t(1 / 2 ) X + t(1 / 2 ) ,
n n
donde: t(1 / 2 ) = tterico es la abscisa de la distribucin t-Student con

(X )
2
X
n 1 grados de libertad, P[t(n 1) < t(1 / 2 ) ] = 1
i
y .
2 S=
n 1

Ejemplo 2.2

80
Una muestra aleatoria de 20 estudiantes de la Facultad de Educa-
cin responden a una prueba de inteligencia espacial, obtenin-
dose una media de 70 y una desviacin tpica de 1 Entre qu l-
mites se hallar la verdadera inteligencia espacial media de los
estudiantes de Educacin, con un nivel de confianza 0.95?. Suponga
que los puntajes medios de la prueba de inteligencia espacial se
distribuyen normalmente.

Solucin

Si / 2 = 0.025 en la tabla t-Student se encuentra: t(1 / 2 ) = tterico =


t( 0.975,19 ) = 2.091 y en la muestra observada se tiene: s = 1 x = 70 .
Luego, un intervalo de confianza del 95% para es:

s s
x t(1 / 2 ) x + t(1 / 2 ) (2.2)
n n
1 1
70 2.091 70 + 2.091
20 20
70 0.4676 70 + 0.4676
69.53 70.47

Luego, la verdadera inteligencia espacial media de los estu-


diantes de Educacin se encuentra entre 69.53 y 70.47, con un ni-
vel de confianza del 95%.

Intervalos de confianza para la media con varianza


desconocida en muestras grandes (cualquier distribucin)

Cuando el tamao de muestra que se toma es suficientemente gran-


de (mayor que 30), an cuando no se conozca la distribucin de la
variable X , por el teorema del lmite central:

X X
Z= t =
y S
n n

81
tienen distribucin aproximadamente normal y pueden usarse
para construir los intervalos de confianza referentes a la media
poblacional.
El intervalo de confianza al nivel (1 ) para la media po-
blacional , con desconocido y en muestras grandes es:
S S
X z(1 / 2 ) X + z(1 / 2 ) .
n n

Ejemplo 2.3

Para estimar el promedio de los salarios docentes de una univer-


sidad, se tom una muestra aleatoria de 50 docentes, donde se
encontr que la media de los sueldos es 840.1 soles y la varianza
es 122.44 (soles)2.
Obtendremos un intervalo de confianza del 95% para esti-
mar la media de los salarios de todos los docentes de esa uni-
versidad.

Solucin

x = 840.1 soles, n = 50 s = 122.44 = 11.07 soles.

A pesar que no se conoce la distribucin poblacional de los


salarios, como la muestra es grande nos basamos en el teorema
del lmite central. As, para = 0.05 el valor de z(1 / 2 ) = 1.96.
Luego, un intervalo para , al nivel de confianza del 95% es:

s s
x z(1 / 2 ) x + z(1 / 2 ) (2.3)
n n
11.07 11.07
840.1 1.96 840.1 + 1.96
50 50
837.03 843.17

El intervalo de confianza al nivel del 95% para la media de

82
los salarios de todos los docentes de esa universidad, es (837.03so-
les, 843.17 soles).

Ejemplo 2.4

Se dise un estudio de muestreo para estimar la deuda de tarje-


tas de crdito anual de los docentes universitarios peruanos. Una
muestra de 85 clientes docentes universitarios proporcion los
balances de tarjetas de crdito que aparecen en la tabla siguiente.
Se va a construir un intervalo de confianza de 95% para la media

Tabla N 2.3. Balances de tarjeta de crdito en dlares anuales


para una muestra de 85 clientes docentes universitarios

9619 5994 3344 7888 7581 9980


5364 4652 13627 3091 12545 8718
8348 5376 968 943 7959 8452
7348 5998 4714 8762 2563 4935
381 7530 4334 1407 6787 5938
2998 3678 4911 6644 5071 5266
1686 3581 1920 7644 9536 10658
1962 5625 3780 11169 4459 3910
4920 5619 3478 7979 8047 7503
5047 9032 6185 3258 8083 1582
6921 13236 1141 8660 2153
5759 4447 7577 7511 8003
8047 609 4667 14442 6795
3924 414 5219 4447 5915
3470 7636 6416 6550 7164

poblacional del balance promedio poblacional de tarjetas de cr-


dito por docente universitario.

Los clculos para obtener la media y desviacin estndar son


muy tediosos, por lo que nos auxiliaremos en el Software SPSS.
Los interesados en mayores detalles pueden remitirse a la biblio-

83
grafa: Estadstica Descriptiva con soporte en SPSS y MATLAB
(Gmez et al., 2005).

Solucin

a) Iniciar la sesin y activar SPSS.


b) Crear el archivo de datos con la variable balance, guardar y
ejecutar los siguientes comandos:
ANALIZE / DESCRIPTIVE STATISTICS / DESCRIPTIVES
/ Seleccionar la variable BALANCE / OPTIONS / activar
MEAN Y STD DEVIATION / CONTINUE / Y OK para eje-
cutar.
El output del SPSS es:

Mean Std.
Deviation
5900 3058

donde la media y la desviacin estndar en la muestra son:


x = 5900 y s = 3058 dlares.
El valor del cuantil z(1 2 ) de la distribucin normal
z = z0,975 = zterico = 1.96 .
(1 )
2

Un intervalo para al nivel de confianza del 95% es:

s s
x z1( / 2 ) x + z(1 / 2 )
n n
3058 3058
5900 1.96 5900 + 1.96
85 85
5900 650.78 5900 + 650.78

5249.22 6550.78

La media poblacional del valor de las tarjetas de crdito para

84
los docentes universitarios peruanos est entre 5249.22 y 6550.78
dlares anuales, con un nivel de confianza del 95%.

Intervalo de confianza para la proporcin poblacional

Para estimar la proporcin poblacional , se usa el siguiente re-


P
sultado: Por el captulo 1 tenemos que P (1 P ) ~ N (0,1) , a par-
n
tir del cual se construye el siguiente intervalo de confianza al ni-
vel (1 ) , para la proporcin poblacional :

P (1 P ) P (1 P )
P z(1 / 2 ) P + z(1 / 2 )
n n

donde:

P es el estimador del parmetro proporcin en la poblacin, ;


z(1 / 2 ) es el percentil de la distribucin normal.

Ejemplo 2.5

En una encuesta de opinin, 320 estudiantes entrevistados de la


Facultad de Educacin declararon estar a favor del candidato del
partido poltico de gobierno a la Presidencia de la Repblica.
a. Hallar un intervalo de confianza, al nivel del 95% para esti-
mar la proporcin a favor.
b. Hallar un intervalo de confianza, al nivel del 99% para esti-
mar la proporcin a favor.
La muestra total fue de 400 estudiantes.

Solucin

A un nivel de confianza del 95%, z(1 / 2 ) = 1.96 .


La proporcin de estudiantes que votan por el partido polti-

85
a 320
co en la muestra es p = = = 0.80 .
n 400
Un intervalo de confianza al nivel del 95%, para la propor-
cin poblacional es:

p (1 p ) p (1 p )
p Z (1 / 2 ) p + Z (1 / 2 ) (2.4)
n n
0.80(0.20 ) 0.80(0.20 )
0.80 1.96 0.80 + 1.96
400 400
0.7608 0.8392

El intervalo al nivel del 95% de confianza para la proporcin


de estudiantes en la poblacin que votan por el partido poltico es
( 76.08%, 83.92%).

Intervalo de confianza para la diferencia de medias de dos poblaciones


con varianzas conocidas

Si X 1 y X 2 son variables aleatorias independientes con distribu-


(2
) 2
( )
ciones N 1 , 1 y N 2 , 2 respectivamente; entonces, las me-
dias muestrales X 1 y X 2 , correspondientes a muestras aleatorias
2
de tamao n1 y n2 , tienen las siguientes distribuciones N 1 , 1
n1
2
y N 2 , 2 . Luego, la variable aleatoria X 1 X 2 es-tandariza-
n2

da, Z =
(X 1 )
X 2 (1 2 )
, tiene distribucin N (0,1) , donde
2
2
+ 2
1
n1 n2

12 22
X 1 X 2 = + .
n1 n2

86
Cabe sealar que si los tamaos de muestra son grandes, a
pesar de que las variables X 1 y X 2 no tienen distribucin nor-

mal, la variable estandarizada, Z =


(X 1 )
X 2 (1 2 )
, tiene dis-
2
2
tribucin aproximadamente normal. + 2
1
n1 n2
A partir de una muestra aleatoria de tamao n1 para la varia-
ble X 1 y de una muestra de tamao n2 para la variable X 2 , varia-
bles independientes, un intervalo para estimar la diferencia de
medias 1 - 2, al nivel de confianza del (1 )100% es:

x1 x 2 z(1 / 2 ) X 1 X 2 1 2 x1 x 2 + z(1 / 2 ) X 1 X 2 (2.5)

Ejemplo 2.6

En un sistema educativo se aplicaron dos mtodos A y B para en-


sear el curso de fsica. En un grupo de 80 estudiantes se aplic el
mtodo A y en el otro de 120 se aplic el mtodo B. Las medias de
las calificaciones obtenidas fueron 12.2 y 10.5 respectivamente.
Podemos admitir que los mtodos de enseanza no son diferen-
tes y que las diferencias encontradas en las muestras se debe al
azar?. Experiencias anteriores dicen que las variables X 1 y X 2
que representan los rendimientos con los mtodos A y B respecti-
vamente, tienen distribucin aproximadamente normal con des-
viaciones estndar 1 = 1.5 puntos y 2 = 0.5 puntos. = 0.05 .
Construiremos un intervalo de confianza al 95% para la dife-
rencia de los rendimientos promedio en la poblacin.

Solucin

Grupo 1 Grupo 2
n1 = 25 n2 = 20
x1 = 12.2 puntos x 2 = 10.5 puntos

87
12 22 (15)2 + (0.5)2
X 1 X 2 = + = = 0.09 + 0.0125 = 0.32
n1 n2 25 20

Basados en el teorema del lmite central, el intervalo de con-


fianza del 95% es:

x1 x 2 z(1 / 2 ) X 1 X 2 1 2 x1 x 2 + z(1 / 2 ) X 1 X 2 (2.6)

(12.2 10.5) + 1.96(0.32 ) 1 2 (12.2 10.5) + 1.96(0.32 )


1.7 0.6272 1 2 1.7 + 0.6272
1.0728 1 2 2.3272

Con una confianza del 95% la diferencia en los rendimientos


promedio de todos los estudiantes del curso de fsica est entre
1.07 puntos y 2.33 puntos.

Intervalo de confianza para la diferencia de medias de dos poblaciones


con varianzas desconocidas, muestras grandes (cualquier distribucin)

Cuando se trata de muestras grandes con varianzas desconoci-


das, el intervalo de confianza al nivel (1 ) para la diferencia de
medias 1 2 es:

X 1 X 2 z(1 / 2 ) S X 1 X 2 1 2 X 1 X 2 + z(1 / 2 ) S X 1 X 2

donde:

S12 S22
S X 1 X 2 = + .
n1 n2

Ejemplo 2.7

88
En una muestra aleatoria de 36 alumnos de la maestra de
2
educacin, la media de edades es x1 = 40 aos y s1 = 9 aos y
en otra muestra aleatoria de 49 alumnos en la maestra de ciencias
sociales, la media de edades de los alumnos es x1 = 35 aos y des-
viacin estndar s2 = 10 de aos. Vamos a obtener el interva-
2

lo de confianza del 95% para la diferencia de medias en la pobla-


cin.

Solucin

s12 s22 9 10
sX 1 X 2 = + = + = 0.6739
n1 n2 36 49
En muestras grandes, con el valor de y con los valores obtenidos
en la muestra se tiene:
( x1 x2 ) z(1 / 2 ) s X 1 X 2 < 1 2 < ( x1 x 2 ) + z(1 / 2 ) s X 1 X 2 (2.7)
(40 35) 1.96(0.6739 ) 1 2 ( 40 35) + 1.96(0.6739 )
3.679 1 2 6.321

Entonces, con un nivel de confianza del 95%, el intervalo para


la diferencia entre las medias de las edades de las dos poblaciones
de alumnos est entre 3.68 y 6.3 aos.

Intervalo de confianza para la diferencia de medias de dos poblaciones


con varianzas desconocidas e iguales
(muestras pequeas)

Como la varianza poblacional es desconocida, tiene que ser esti-


mada y en lugar de la variable estandarizada Z, se tiene la varia-
ble aleatoria:

( X 1 X 2 ) (1 2 ) , cuya distribucin es t-Student con


t=
1 1
S p2 +

n1 n2

89
(n1 + n2 2 ) grados de libertad y se denota con ( n1+n22 ) . Como t
hay n1 1 grados de libertad asociados con la muestra aleatoria
de la poblacin 1, y n2 2 grados de libertad para la poblacin 2,
la distribucin t tendr (n1 + n2 2) grados de libertad.
El estimador de la varianza poblacional es

S p2 =
(n 1)S + (n 1)S
1
2
1 1
2
2
.
n +n 2
1 2

2
Si S p es el estimador de 2 , entonces el estimador puntual

1 1
de X 1 X 2 cuando 12 = 22 = 2 es S X X = S p2 + .
1 2
n1 n2
Ahora se puede emplear la distribucin t-Student para en-
contrar un intervalo de confianza para la diferencia entre las me-
dias de las poblaciones.
Si se observa una muestra aleatoria de tamao n1 para la va-
riable X 1 y una muestra de tamao n2 para la variable X 2 , donde
X 1 y X 2 son variables independientes con varianzas desconoci-
das, el intervalo para estimar la diferencia de medias 1 2 , al
nivel de confianza (1 )100% es:

( x1 x 2 ) t(1 / 2 ) s X 1 X 2 1 2 ( x1 x 2 ) + t(1 / 2 ) s X 1 X 2 (2.8)

donde:

1 1
s X 1 X 2 = s 2p + y para > 0 , P (t( n1 +n2 2 < tterico ) = 1-,
n1 n2
entonces en la tabla t-Student se encuentra el valor de t(1 / 2 ) =
t(terico) , la abscisa de la distribucin t-Student con n1 + n2 2 gra-
dos de libertad.

Ejemplo 2.8

Con el fin de comparar los promedios de tiempo, en que los traba-

90
jadores de una determinada universidad de dos turnos diferentes
A y B, realizan una tarea, se registraron los tiempos correspon-
dientes a 9 trabajadores de cada uno de los turnos. Para el turno A
se obtuvo:

32 min, 37min, 35min, 28min, 41min, 44min, 35min, 31min, 34min


y para el turno B: 35min, 31min, 29min, 25min, 34min, 40min,
27min, 32min, 31min.

Encontraremos un intervalo de confianza del 95% para la di-


ferencia entre las medias de los tiempos de las tareas realizadas
por los trabajadores de los turnos A y B.

Solucin

Supongamos que esos tiempos se distribuyen normalmente y que


las varianzas de los mismos son iguales. Utilizaremos el SPSS para
resolver encontrar las medias y varianzas de las muestras.
a) Iniciar la sesin y activarStatistics
SPSS.

Tiempo A Tiempo B

N 9 9
Mean 35.22 31.56
Std. Deviation 4.94 4.48

b) Crear el archivo de datos con las variables tiempoA y tiem-


poB. Despus de crear la base de datos ejecutar los siguientes
comandos:
ANALIZE / DESCRIPTIVE STATISTICS / DESCRIPTIVES
/ Seleccionar las variables TIEMPOA y TIEMPOB/ OPTIO-
NS / activar MEAN Y STD DEVIATION / CONTINUE / OK.
El output del SPSS nos muestra:

Se obtiene el valor de la varianza combinada:

s 2p =
(n1 1)s12 + (n2 1)s22 =
8(4,94 ) + 8(4,48)
2 2

n1 + n2 2 16

91
195.20 + 160.56 355.76
= = = 22.24 ,
16 16

y la estimacin de la desviacin estndar para la diferencia


de medias es:

1 1 1 1
s X 1 X 2 = s 2p + = 22.24 + = 4.89 = 2.21.
n1 n2 9 9
Con n1 + n2 2 = 9 + 9 2 = 16 grados de libertad, = 0.05 ,
( )
se cumple P t(16 ) < tterico = 0.975, entonces en la tabla t-Student
se encuentra el valor de t(1 / 2 ) = tterico = 2.12 .
El intervalo de 95% de confianza para la diferencia de medias
poblacionales es:

( x1 x 2 ) t(1 / 2 ) s X 1 X 2 1 2 ( x1 x 2 ) + t(1 / 2 ) s X 1 X 2

(35.22 31.56) (2.12)(2.21) 1 2 (35.22 31.56) + (2.12)(2.21)

1.03 1 2 8.35

As, con un nivel de confianza del 95%, la diferencia de los


tiempos medios de las tareas realizadas para todos los trabajado-
res de los turnos A y B se encuentra entre -1.03 minutos y 8.3 mi-
nutos.

Intervalo de confianza para la diferencia entre las proporciones de dos


poblaciones

En las poblaciones 1 y 2, con respectivas proporciones poblacio-


nales 1 y 2 (de estudiantes, profesores, etc., para ser ms gen-
ricos, de "unidades"), con determinados atributos; se desea encon-
trar un intervalo de confianza para la diferencia de proporciones
1 2 .
Los parmetros que son las proporciones poblacionales tie-
A
nen como estimadores en cada una de las muestras: P1 = y
n1

92
B
P2 = , donde A es el nmero de elementos con el atributo de
n1
inters en la primera muestra y B es el nmero de elementos con
el mismo atributo en la segunda muestra. Cuando las muestras son
( P1 P2 ) ( 1 2 )
suficientemente grandes, la estadstica tiene dis-
1 1
P (1 P ) +
nn1 P n+2 n P
tribucin aproximadamente normal, donde P = 1 1 2 2 . Una
n1 + n2
n1 p1 + n2 p2
estimacin comn de 1 = 2 = , es p = .
n1 + n2
El intervalo de confianza (1 ) % para la diferencia de pro-
porciones es:

( P1 P2 ) z(1 / 2 ) S p 1 2 ( P1 P2 ) + z(1 / 2 ) S p ,

1 1
donde S p = P(1 P ) + .
n1 n2

Ejemplo 2.9

Al Ministerio de Educacin le interesa comparar la calidad del


trabajo que se realiza en las oficinas regionales rurales del norte y
del sur. Se seleccionan muestras aleatorias de expedientes de do-

Expedientes Oficina Oficina


regional norte regional sur

Nmero expedientes analizados 250 300

Nmero de expedientes con errores 35 27

centes que trabajan en las reas rurales norte y sur, que solicitan
traslado a reas metropolitanas, para obtener un intervalo de con-
fianza para la diferencia entre las proporciones de expedientes con
errores en las dos zonas rurales. A continuacin se tiene el nme-

93
ro total de expedientes y el nmero de expedientes con errores en
cada una de las oficinas regionales.
Solucin

1: Proporcin de expedientes con error en la oficina regional nor-


te, en la poblacin.
2: Proporcin de expedientes con error en la oficina regional sur,
en la poblacin.
p1: Proporcin de expedientes con error en la oficina regional nor-
te, en la muestra.
p2: Proporcin de expedientes con error en la oficina regional sur,
en la muestra.
35 27
p1 = = 0.14 p2 = = 0.09
250 300
p1 p2 = 0.05
n1 p1 + n2 p2 250(0.14) + 300(0.09)
p= p= = 0.1127
n1 + n2 550

1 1 1 1
sp = p (1 p ) + = 0.1127 (0.8873) + = 0.027

250 300
n1 n2

Para un nivel de confianza del 90%, en la tabla normal se


encuentra z(1 / 2 ) = z0, 95 = 1.645 . Luego:

( p1 p2 ) z(1 / 2 ) s p 1 2 ( p1 p2 ) + z(1 / 2 ) s p (2.9)


( 0.14 0.09) 1.645(0.0275) 1 2 ( 0.14 0.09) + 1.645(0.0275)
0.05 0.045 1 2 0.05 + 0.045
0.005 1 2 0.095

Con un nivel de confianza del 90%, la diferencia entre las ta-


sas de errores de todos los trabajadores de las dos oficinas, se en-
cuentra entre 0.5% y 9.5%.

Intervalo de confianza para la varianza de una poblacin

94
En secciones anteriores describimos mtodos de inferencia esta-
dstica, donde intervenan medias y proporciones poblacionales.
En esta seccin ampliaremos el campo a casos donde intervienen
inferencias acerca de varianzas de la poblacin.
En el captulo anterior utilizamos la varianza muestral
(X ) , como estimador puntual de la varianza pobla-
2
X
i
S2 =
n 1
cional .
2

Figura N 3.1: Ejemplos de la Distribucin Muestral de (n 1)S 2 / 2


(Distribucin Ji Cuadrado)

Con 2 grados de libertad Con 5 grados de libertad

Con 10 grados de libertad

0 (n 1)S 2
2
Siempre que se selecciona una muestra aleatoria simple del
S2
tamao n de una poblacin normal, la expresin: (n 1) , tiene
2
una distribucin ji-cuadrado con n 1 grados de libertad.

Usaremos el smbolo para representar el valor de la dis-


2

tribucin Ji-cuadrado que da como resultado un rea, o probabili-


Figura N 3.2: Distribucin Ji cuadrado con
n 1 grados de libertad

/2

/2
1
0 2 / 2 12 / 2

95
dad, de a la derecha del valor establecido.
Usando esta distribucin se obtiene los percentiles ( / 2 ) y
2

(21 / 2 ) de tal manera que cada una de las reas que se indican en
la siguiente figura sean iguales a / 2 .

As que,


P / 2
(n 1)S 2 = 1
1 / 2
2
Luego, el intervalo para 2 , al nivel de confianza 1 , es:

(n 1)S 2 2

(n 1)S 2
,
12 / 2 2 / 2

donde los valores de son los percentiles de la distribucin


2

chi-cuadrado con n 1 grados de libertad, y 1 es el coeficiente


de confianza.

Ejemplo 2.10

Una muestra aleatoria de 20 estudiantes de la especialidad de bio-


loga ha rendido el examen de matemticas, en el que ha obtenido
una media de x = 72 puntos con varianza s 2 = 16 puntos. Supon-
dremos que las calificaciones se distribuyen normalmente y cons-
truiremos un intervalo de confianza para la varianza poblacional
de puntajes, 2 , con un nivel de confianza del 90%.

Solucin

n = 20 , s 2 = 16 puntos2, x = 72 puntos.

Para el nivel de confianza 1 = 0.95 , los valores de los per-


centiles de la distribucin ji-cuadrado con n 1 = 19 grados de li-
bertad son 02.05 = 10.12 y 02.95 = 30.14 . As:

(20 1)s 2 2
(20 1)s 2
(2.10)
12 / 2 2 / 2

96
(20 1)16 2 (20 1)16
30.14 10.12

10.09 2 30.04

Luego, con el nivel de confianza del 90%, la varianza poblacio-


nal de puntajes se encuentra entre 10.09 puntos2 y 30.04 puntos2.

Ejercicios

Para una muestra aleatoria de 6 estudiantes matriculados en el


curso de estadstica se tiene los tiempos en horas semanales que
dedican a estudiar: 5 8 10 7 10 14
a. Defina la variable de inters.
b. Caracterice la media poblacional y la varianza poblacional.
c. Cul es el valor de la estimacin puntual de la media de la
poblacin? Interprete.
d. Cul es el valor de la estimacin puntual de la desviacin
estndar de la poblacin?.

A una muestra aleatoria de 150 alumnos de la universidad,


se le pregunt si haba estudiado el idioma ingls. 75 respondie-
ron S, 55 respondieron No y 20 no opinaron.
a. Cul es el valor de la estimacin puntual de la proporcin
de la poblacin que responde S?.
b. Cul es el valor de la estimacin puntual de la proporcin
de la poblacin que respondi No?.
c. Encuentre el intervalo de confianza del 90% para la propor-
cin poblacional que respondieron S.

Fuente de ingresos Frecuencia


Propina slo domingos 149
Quehaceres, ddivas y domingos 219
Quehaceres y ddivas, no domingos 251
Nada 165
Total 784

97
A una muestra aleatoria de 784 nios, cuyas edades fluctua-
ban de 9 a 14 aos, se les pregunt en qu forma conseguan dine-
ro de sus padres (Consumer Reports, enero de 1997). las respues-
tas fueron las siguientes:

a. Qu proporcin de nios recibe propina slo los domingos?.


b. Qu proporcin de nios recibe dinero por quehaceres y d-
divas, pero no recibe los domingo?
c. Qu proporcin de nios recibe dinero por quehaceres, d-
divas y tambin domingos?

El departamento de transporte en Estados Unidos, publica


estadsticas de llegadas, antes o despus del horario programado,
de los principales vuelos ( Associated Press, 8 de septiembre de
2000). Suponga que la proporcin estimada de vuelos que llegan
a tiempo, para todas las aerolneas, se basa en una muestra aleato-
ria de 1400 vuelos. Si 1117 llegan a tiempo, cul es la estimacin
puntual de la proporcin de vuelos que llegan a tiempo?.
Encuentre el intervalo de confianza del 90% para la propor-
cin poblacional de vuelos que llegan a tiempo.
Louis Harris encuest a una muestra aleatoria de 108 adultos
para conocer su opinin acerca de la educacin (Education Week,
7 de agosto de 2000). Las respuestas fueron las siguientes:

595 adultos: la est mejorando


332 adultos: la educacin permanece igual.
81 adultos: la educacin est empeorando.

Encuentre la estimacin puntual de los siguientes parmetros


de la poblacin:
a. La proporcin de adultos que opinan que la educacin est
mejorando.
b. La proporcin de adultos que piensan que la educacin per-
manece igual.
c. La proporcin de adultos que piensan que la educacin est

98
empeorando.

Para estimar la media del consumo (dlares) en el restaurante


de una gran universidad, se tom una muestra de 49 profesores.
Suponga una desviacin estndar poblacional de 5 dlares.
Si la media en la muestra fue 24.80 dlares mensuales. Cul
fue el intervalo de confianza del 95% para el consumo medio po-
blacional?.
En una muestra aleatoria de 20 alumnos en el curso de esta-
dstica aplicada a la educacin, se encontr una media de 70 pun-
tos y una desviacin tpica de 9 puntos en las calificaciones fina-
les. Encuentre el intervalo de confianza del 90% para la media de
todas las calificaciones, suponiendo que se distribuyen normal-
mente.
Quince alumnos de un colegio fueron pesados, obtenindose:
42.70 kg. 43.48 kg 49.68 kg. 42.78 kg. 43.18 kg. 42.56 kg. 42.76 kg.
42.87 kg. 42.95 kg. 43.39 kg. 42.01 kg. 43.06 kg. 41.60 kg. 43.20 kg.
43.10 kg. Suponiendo que los pesos se distribuyen normalmente,
obtenga el intervalo de confianza del 99% para la media de los
pesos de todos los estudiantes del colegio.
Los estudiantes de la Facultad de Educacin de una uni-
versidad de prestigio pudieron elegir entre un curso de esta-
dstica sin laboratorio de tres horas semanales y otro curso de
estadstica con laboratorio de cuatro horas semanales. El exa-
men escrito final fue el mismo para las dos secciones. Si 12 estu-
diantes de la seccin con laboratorio tuvieron una calificacin pro-
medio de 84 con una desviacin estndar de 4, y 18 estudiantes de
la seccin sin laboratorio alcanzaron una calificacin promedio de
77 con una desviacin estndar de 6, encuentre un intervalo de
confianza del 99% para la diferencia entre las calificaciones pro-
medio de los dos cursos. Suponga que las poblaciones se distribu-
yen de manera aproximadamente normal con varianzas iguales.
En un estudio que realiz la universidad de Cornell acerca de
las diferencias salariales entre hombres y mujeres se dio a conocer
que una de las razones por las que los salarios de los hombres
sean mayores que los salarios de las mujeres es que, los hombres

99
Hombres Mujeres

x1 = 14.9 aos de trabajo x 2 = 10.3 aos de trabajo


s1 = 5.2 s2 = 3.8 aos
n1 = 100 n2 = 85

tienden a acumular ms aos de experiencia que las mujeres (Bu-


siness Wek, 28 de agosto de 2000). Se tomaron dos muestras alea-
torias independientes y se encontr:

a. Cul es la estimacin puntual de la diferencia de medias


poblacionales de los salarios de hombres y mujeres?.
b. Encuentre el intervalo de confianza del 95% para la diferen-
cia entre las dos medias poblacionales.

Un grupo de investigadores desea estimar la diferencia entre


las medias de los ingresos anuales de familias en dos zonas de

Zona 1 Zona 2

x1 = 15 700 soles x 2 = 14 500 soles

s1 = 700 soles s2 = 14 500 soles

n1 = 8 n2 = 12

Lima Metropolitana. En muestras aleatorias independientes de


familias residentes en las dos zonas se encontr los siguientes re-
sultados:

a. Encontrar la estimacin puntual para la diferencia entre las


medias de los ingresos de las dos zonas
b. Determine un intervalo de confianza del 95% para esa dife-
rencia?.
c. Qu suposiciones hizo para encontrar el intervalo en el

100
inciso b?.

Una encuesta de Gallup, en 1994, determin que el 16% de


505 varones y 25% de 496 mujeres encuestados en una universi-
dad, estuvieron a favor de prohibir la venta libre de cerveza, vi-
nos y licores en el pas. Encuentre un intervalo de confianza de
95% para la diferencia entre las proporciones de mujeres y varo-
nes de esa universidad que estuvieron a favor de la prohibicin.
Usted es un inspector de escuelas pblicas y realiza un experi-
mento para investigar si la habilidad en lectura de los estudiantes
de primer ao de secundaria ha mejorado o no. Si en una muestra
aleatoria de 185 estudiantes de esta poblacin encuentra una habili-
dad media de lectura igual a 75 palabras por minuto, encuentre el
intervalo de confianza del 90% para la habilidad media en lectura
de todos los estudiantes de primer ao de secundaria.
El Director Acadmico del centro pre universitario de la UFV
tiene la percepcin que el rendimiento acadmico durante el pri-
mer ao de estudios en la universidad, de los alumnos ingresan-
tes a travs de la institucin que dirige, ha sufrido cambios en los
ltimos aos. Para confirmar su percepcin llev a cabo un estu-
dio, para el que escogi una muestra aleatoria de 150 alumnos
que ingresaron el ao 2004 a travs del centro pre universitario y
pidi al sistema de matrcula el rendimiento de cada uno de estos
alumnos durante el ao acadmico 2004. Para dicha muestra ob-
tuvo de rendimiento promedio 14.5 puntos con desviacin estn-
dar 0.5 puntos. Suponga normalidad y encuentre el intervalo de
confianza del 90% para la media poblacional del rendimiento.
Caracterice con precisin los parmetros poblacionales.
Para determinar el efecto sobre el desarrollo psicolgico de
los escolares que tienen que viajar a la escuela en mnibus de ser-
vicio pblico, se tom una prueba de ansiedad a un grupo de 40
escolares que usan este sistema de transporte y a 30 escolares que
en mnibus caminando

x1 = 145 x2 = 135

101
van caminando al colegio. Se sabe que las desviaciones estndar
en ambas poblaciones son 9 y 12 respectivamente.
Los resultados de la prueba de ansiedad son los siguientes:

Suponiendo normalidad, encuentre un intervalo de confian-


za del 90% para la diferencia entre las ansiedades medias. Use.
Antes de aplicar el Plan Huascarn en el distrito de Cajatam-
bo, el rendimiento promedio de los estudiantes de primer ao de
primaria era de 12 puntos. Para determinar si el Plan ha sido efec-
tivo en el incremento del rendimiento de los estudiantes, se obser-
varon al azar a 150 estudiantes despus de aplicar el plan durante
un ao acadmico, obtenindose de rendimiento promedio 13.5
puntos con desviacin estndar 2.1 puntos. Encuentre el intervalo
de confianza para el rendimiento promedio. Use la metodologa
correspondiente para dar respuesta a la pregunta planteada y de
ser necesario suponga normalidad.
Un investigador en el campo educativo sostuvo que el mdu-
lo didctico empleado en la enseanza de matemticas es uno de
los factores que influye y determina en el proceso de enseanza
aprendizaje y por lo tanto, el mdulo adoptado incide en el rendi-
miento acadmico de los estudiantes. Para verificar su hiptesis
realiz el siguiente experimento: durante un semestre se llev a
cabo el trabajo lectivo para dos grupos de estudiantes de la mis-

Mtodo A 12 13 12 10 10 13 13 11 14

Mtodo B 16 17 117 14 15 17 16 16 15

ma carrera en la misma universidad, empleando dos mdulos (A


y B) de caractersticas bien diferenciadas. Al final del curso aplic
el mismo examen y obtuvo las siguientes notas.

Suponiendo que las muestras provienen de poblaciones nor-


males con varianzas iguales, construya el intervalo de confianza
del 90% para la diferencia de medias poblacionales.

102
Un grupo de 350 estudiantes fueron divididos aleatoriamen-
te en dos subgrupos de 100 y 150 estudiantes. Los de la muestra 1
aprendieron determinado material en el cual se enuncia verbal-
mente el concepto de transitivitas de "ms alto que", a continua-
cin de lo cual se dieron varios ejemplos de la situacin; a los es-
tudiantes del grupo 2 se les expuso ejemplos tras de lo cual se
enunci verbalmente el concepto. Son dos las poblaciones subya-
centes a las muestras y que hubieran podido participar en el expe-
rimento. Al finalizar el experimento, 62 estudiantes de la muestra
1 y 70 estudiantes de la muestra 2 dominaban el concepto de tran-
sitividad. Encuentre un intervalo de confianza del 95% para la di-
ferencia de proporciones poblacionales. Previamente caracterice
los parmetros poblacionales.

103

You might also like