You are on page 1of 14

ESTADSTICA II

GUIA 3. DISTRIBUCCIONES DE MUESTREO




Objetivos:

- Construir la distribucin muestral de la media de una poblacin pequea.
- Comprobar que la media aritmtica de la poblacin y la media aritmtica de las medias es la
misma.
- Verificar que la desviacin estndar de la poblacin es mayor que la de la distribucin de
muestreo de las medias.
- Aplicar el teorema correctamente el Teorema central del lmite.


Metodologa:

En este taller los estudiantes:
Leen los conceptos, estudian los ejemplos y resuelven los ejercicios planteados.
Asisten a las clases programadas por la Universidad.
Plantean sus inquietudes al tutor a travs de Chats, correo electrnico, clases virtuales.

Indicadores:

- Construyen distribuciones de muestreo.
- Aplican correctamente el Teorema central del lmite.
- Calculan el error estndar.

ACTIVIDAD 1: Aspectos Tericos

Lea y analice cuidadosamente la siguiente teora y los siguientes ejemplos

Distribucin muestral de medias:
La distribucin muestral de la media es una distribucin de probabilidad de todas las
posibles medias muestrales, de un tamao de muestra dado, seleccionadas de una
poblacin.
Para fines de entender mejor el concepto de "distribucin muestral de medias"
estudiemos la siguiente poblacin. Don Pepe en su restaurante tiene 5 parrilleros
(poblacin), a los cuales se les paga por hora segn su trabajo. Las percepciones de
los parrilleros son las siguientes:
Parrillero Percepcin por hora
Adrin $ 9.00
Blas $ 8.00
Carmela $ 8.00
Diana $ 8.00
Enrique $ 7.00
La poblacion en este ejemplo son los ingresos de los parrilleros, es decir N = 5. Si
calculamos la media de esta poblacin obtendramos:


=
9 + 8 + 8 + 8 + 7
= 8.0
5
Para facilitar la explicacin y comenzar a elaborar la distribucin muestral de medias,
vamos a fijar el tamao de muestra (n) en 2. Formamos todas las posibles muestras de
tamao 2, y como vemos en el siguiente cuadro son 10, y a cada una le calculamos la
media.
muestra parrilleros percepciones media
1 A - B 9.00 8.00 8.50
2 A - C 9.00 8.00 8.50
3 A - D 9.00 8.00 8.50
4 A - E 9.00 7.00 8.00
5 B - C 8.00 8.00 8.00
6 B - D 8.00 8.00 8.00
7 B - E 8.00 7.00 7.50
8 C - D 8.00 8.00 8.00
9 C - E 8.00 7.00 7.50
10 D - E 8.00 7.00 7.50
A continuacin elaboramos una distribucin de probabilidad con las medias de las
muestras, quedando de la siguiente manera:
Distribucin Muestral de Medias para n=2
media muestral frecuencia probabilidad
7.50 3 0.3
8.00 4 0.4
8.50 3 0.3
suma 10 1.0
Calculamos la media de la distribucin que acabamos de hacer:

Los histogramas de la distribucin de probabilidad de la poblacin y de la distribucin
muestral de medias son:



A partir de las observaciones anteriores podemos decir que la media de las medias
muestrales es igual a la media de la poblacin y que la forma de la distribucin
muestral presenta un cambio respecto a la forma de la poblacin.
Teorema Central del Lmite:
El Teorema del Lmite Central consiste en un conjunto de resultados acerca del
comportamiento de las distribuciones muestrales. en el se afirma, bajo ciertas hiptesis,
que la distribucin de las medias de un nmero muy grande de muestras se aproxima a
una distribucin normal.
El trmino Central, debido a Poly (1920), significa fundamental, o de mportancia
central, este describe el rol que cumple este teorema en la teora de la probabilidad.
Muchos grandes matemticos colaboraron para desarrollar el teorema del lmite
central, sin embargo Laplace ocupa un lugar fundamental: a pesar de que nunca
enunci formalmente este resultado, ni lo demostr rigurosamente, a l le debemos
este importante descubrimiento.




Teorema Central del Lmite:
"Para una poblacin con una media y una varianza o
2
, la distribucin de las medias
de todas las muestras posibles de tamao n generadas de la poblacin estarn
distribuidas de forma aproximadamente normal asumiendo que el tamao de la
muestra es suficientemente grande."
Con relacin al teorema del lmite central debemos enfatizar en:
1. Si el tamao de la muestra n es suficientemente grande (n > 30) la distribucin
muestral de las medias ser aproximadamente normal. No importa si la poblacin es
normal, sesgada o uniforme, si la muestra es grande el teorema se aplicar.
2. La media de la poblacin y la media de todas las posibles muestras son iguales. Si la
poblacin es grande y un gran nmero de muestras son seleccionadas de esa
poblacin entonces la media de las medias muestrales se aproximar a la media
poblacional.
3. La desviacin estndar de la distribucin muestral de las medias, a la que
llamaremos error estndar, es determinado por:



ACTIVIDAD 2: Taller de aplicacin

LABORATORIO No 1.


1. Elementos de Muestreo
Uno de los propsitos de la estadstica inferencial es estimar las caractersticas
poblacionales desconocidas, examinando la informacin obtenida de una muestra, de
una poblacin. El punto de inters es la muestra, la cual debe ser representativa de la
poblacin objeto de estudio.
Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras
reflejen observaciones a la poblacin de la que proceden, ya que solo se pueden hacer
observaciones probabilsticas sobre una poblacin cuando se usan muestras
representativas de la misma.
Una poblacin est formada por la totalidad de las observaciones en las cuales se
tiene cierto observa.
Una muestra es un subconjunto de observaciones seleccionadas de una poblacin.
Muestras Aleatorias


Cuando nos interesa estudiar las caractersticas de poblaciones grandes, se utilizan
muestras por muchas razones; una enumeracin completa de la poblacin, llamada
censo, puede ser econmicamente imposible, o no se cuenta con el tiempo suficiente.
A continuacin se ver algunos usos del muestreo en diversos campos:
1. Poltica. Las muestras de las opiniones de los votantes se usan para que los
candidatos midan la opinin pblica y el apoyo en las elecciones.
2. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes se usan para
determinar la eficiencia de una tcnica o programa de enseanza.
3. Industria. Muestras de los productos de una lnea de ensamble sirve para controlar la calidad.
4. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos prueban la
eficacia de una tcnica o de un frmaco nuevo.
5. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la produccin los
efectos de un fertilizante nuevo.
6. Gobierno. Una muestra de opiniones de los votantes se usara para determinar los criterios del
pblico sobre cuestiones relacionadas con el bienestar y la seguridad nacional.
La aleatorizacin se refiere a cualquier proceso de seleccin de una muestra de la
poblacin en el que la seleccin es imparcial o no est sesgada; una muestra elegida
con procedimientos aleatorios se llama muestra aleatoria.
Los tipos ms comunes de tcnicas de muestreo aleatorios son el muestreo aleatorio
simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo
sistemtico.
Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria
simple.
Ejemplo 1.1
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadstica de 20 alumnos.
20
C
5
da el nmero total de formas de elegir una muestra no
ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si
listamos las 15,504 en trozos separados de papel, una tarea tremenda, luego los
colocamos en un recipiente y despus los revolvemos, entonces podremos tener una
muestra aleatoria de 5 si seleccionamos un trozo de papel con cinco nombres. Un
procedimiento ms simple para elegir una muestra aleatoria sera escribir cada uno de
los 20 nombres en pedazos separados de papel, colocarlos en un recipiente,
revolverlos y despus extraer cinco papeles al mismo tiempo.
Otro mtodo parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20
utiliza una tabla de nmeros aleatorios. Se puede construir la tabla usando una
calculadora o una computadora. Tambin se puede prescindir de estas y hacer la tabla
escribiendo diez dgitos del 0 al 9 en tiras de papel, las colocamos en un recipiente y
los revolvemos, de ah, la primera tira seleccionada determina el primer nmero de la
tabla, se regresa al recipiente y despus de revolver otra vez se selecciona la seguida
tira que determina el segundo nmero de la tabla; el proceso contina hasta obtener
una tabla de dgitos aleatorios con tantos nmeros como se desee.


Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico,
imposible o no deseado; aunque sera deseable usar muestras aleatorias simples para
las encuestas nacionales de opinin sobre productos o sobre elecciones
presidenciales, sera muy costoso o tardado.
El muestreo estratificado requiere de separar a la poblacin segn grupos que no se
traslapen llamados estratos, y de elegir despus una muestra aleatoria simple en cada
estrato. La informacin de las muestras aleatorias simples de cada estrato constituira
entonces una muestra global.
Ejemplo 1.2
Suponga que nos interesa obtener una muestra de las opiniones de los profesores de
una gran universidad. Puede ser difcil obtener una muestra con todos los profesores,
as que supongamos que elegimos una muestra aleatoria de cada colegio, o
departamento acadmico; los estratos vendran a ser los colegios, o departamentos
acadmicos.
El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de
unidades heterogneas entre s de la poblacin llamadas conglomerados. Cada
elemento de la poblacin pertenece exactamente a un conglomerado, y los elementos
dentro de cada conglomerado son usualmente heterogneos o dismiles.
Ejemplo 1.3
Suponga que una compaa de servicio de televisin por cable est pensando en abrir
una sucursal en una ciudad grande; la compaa planea realizar un estudio para
determinar el porcentaje de familias que utilizaran sus servicios, como no es prctico
preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al azar,
la cual forma un conglomerado.
En el muestreo por conglomerados, stos se forman para representar, tan fielmente
como sea posible, a toda la poblacin; entonces se usa una muestra aleatoria simple
de conglomerados para estudiarla. Los estudios de instituciones sociales como iglesias,
hospitales, escuelas y prisiones se realizan, generalmente, con base en el muestreo
por conglomerados.
El muestreo sistemtico es una tcnica de muestreo que requiere de una seleccin
aleatoria inicial de observaciones seguida de otra seleccin de observaciones obtenida
usando algn sistema o regla.
Ejemplo 1.4
Para obtener una muestra de suscriptores telefnicos en una ciudad grande, puede
obtenerse primero una muestra aleatoria de los nmeros de las pginas del directorio
telefnico; al elegir el vigsimo nombre de cada pgina obtendramos un muestreo
sistemtico, tambin podemos escoger un nombre de la primera pgina del directorio y
despus seleccionar cada nombre del lugar nmero cien a partir del ya seleccionado.
Por ejemplo, podramos seleccionar un nmero al azar entre los primeros 100;


supongamos que el elegido es el 40, entonces seleccionamos los nombres del
directorio que corresponden a los nmeros 40, 140, 240, 340 y as sucesivamente.
2. Distribuciones de muestreo.

Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia,
impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y
tomadas de la misma poblacin tenga la misma media muestral o que sean
completamente parecidas; puede esperarse que cualquier estadstico, como la media
muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de
una muestra a otra, por ello, se quiere estudiar la distribucin de todos los valores
posibles de un estadstico. Tales distribuciones sern muy importantes en el estudio de
la estadstica inferencial, porque las inferencias sobre las poblaciones se harn usando
estadsticas muestrales. Como el anlisis de las distribuciones asociadas con los
estadsticos muestrales, podremos juzgar la confiabilidad de un estadstico muestral
como un instrumento para hacer inferencias sobre un parmetro poblacional
desconocido.
Como los valores de un estadstico, tal como X, varan de una muestra aleatoria a otra,
se le puede considerar como una variable aleatoria con su correspondiente distribucin
de frecuencias.
La distribucin de frecuencia de un estadstico muestral se denomina distribucin
muestral. En general, la distribucin muestral de un estadstico es la de todos sus
valores posibles calculados a partir de muestras del mismo tamao.
3. Distribucin de la media muestral.
Si recordamos a la distribucin normal, esta es una distribucin continua, en forma de
campana en donde la media, la mediana y la moda tienen un mismo valor y es
simtrica.
Con esta distribucin podamos calcular la probabilidad de algn evento relacionado
con la variable aleatoria, mediante la siguiente frmula:
o

=
X
Z

En donde z es una variable normal estandar con media igual a cero y varianza igual a
uno. Con esta frmula se pueden hacer los clculos de probabilidad para cualquier
ejercicio, utilizando la tabla de la distribucin z.
Sabemos que cuando se extraen muestras de tamao mayor o igual a 30 o menor de
30 de una poblacin normal con varianza conocida, la distribucin muestral de las
medias tiene un comportamiento aproximadamente normal, por lo que se


Puede utilizar la formula de la distribucin normal con

y
o
, entonces la frmula
para calcular la probabilidad del comportamiento del estadstico, en este caso la media
de la muestra, quedara de la siguiente manera:
Z =
n
X M
o
) (

Ejemplo:
Una empresa elctrica fabrica focos que tienen una duracin que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviacin estndar de
40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga
una vida promedio de menos de 775 horas.
Solucin:
La pregunta es P[M(X) ] 775 s
En excel ingresamos por la opcin que tiene el icono fx, y seleccionamos la funcin
Estadsticas y de estas seleccionamos DISTR.NORM.ESTAND como se aprecia en
la siguiente pantalla:


Al darle aceptar, el sistema despliega la siguiente pantalla:



Como el valor estandarizado es Z = 5 . 2
16
40
800 775
=

, ingresamos el valor de 2,5,


obteniendo que: P[M(X) ] 775 s = 0.00620990
La interpretacin sera que la probabilidad de que el tiempo de duracin promedio de la
muestra de 16 focos sea menor a 775 horas es de 0.0062.
Sabemos que cuando se extraen muestras de una poblacin normal con varianza
desconocida, la distribucin muestral de las medias tiene una distribucin T-student,
por lo que se puede utilizar la formula de la distribucin T-student con

y Sx,
entonces la frmula para calcular la probabilidad del comportamiento del estadstico, en
este caso la media de la muestra , quedara de la siguiente manera:


T =
n
Sx
X M ) (


Ejemplo: Un fabricante asegura que para cierto automvil que fabrica, el consumo de
gasolina en carretera es de 72 kilmetros por galn. TAL CUAL adquiere uno de estos
automviles con el propsito de verificar la cifra proporcionada por el fabricante. El
automvil recorri una distancia de 160 kilmetros en 25 oportunidades. En cada
recorrido se apunto la cantidad de galones para realizar el viaje. En los 25 ensayos el
promedio y la desviacin estandar tuvieron un valor de 69,6 y 4 kilmetros por galn
respectivamente. Si se supone que el nmero de kilmetros por galn que recorre el
automvil, es una variable aleatoria que se distribuye normalmente, con base en esta
prueba existe alguna razn para dudar de la afirmacin de fabricante?
Solucin:
Debe verificarse la veracidad de la informacin proporcionada por el fabricante con
base en la probabilidad. Esto es, si fuese realmente igual a 72 kilmetros por galn,
cual es la probabilidad de que se observe un valor de la media muestral no mayor de
69,6 kilmetros por galn, con base en una muestra de tamao 25 y una estimacin de
o igual a 4?.
Luego la P[M(X) ] 6 , 69 s = P
(
(
(

25
4
72 6 , 69 ) (
n
S
X M
= P | | 3 s T
En Excel ingresamos por la opcin que tiene el icono fx, y seleccionamos la funcin
Estadsticas y de estas seleccionamos DISTR.Tcomo se aprecia en la siguiente
pantalla:







Al dar la opcin aceptar, el sistema despliega la siguiente pantalla:



Antes de proceder a ingresar los valores solicitados, debemos tener en cuenta que
EXCEL no da la funcin de distribucin, da es P[X ] x > . Por simetra de la distribucin
T-student sabemos que la P[X ] 3 s = P[X ] 3 > . Con esta aclaracin procedemos a
ingresar la informacin que se solicita, X, corresponde al valor de la T-student, es decir,
3; los grados de libertad son (n-1), sea 24; y las colas en este caso corresponde a una
cola puesto que es la P[T ] 3 > .







As las cosas la P[X ] 3 s = 0.0031, como se aprecia en la siguiente pantalla:

Conclusin: Si la verdadera media es 72, la probabilidad de observar un valor de T no mayor a 3, es
menor de 0.005; sin embargo se ha observado, luego tiene un valor menor a 72.
EJ ERCICIOS A DESARROLLAR CON LA AYUDA DE EXCEL
1. Para cierta prueba de conocimientos generales, se sabe con base en la
experiencia que el nmero promedio de aciertos es de 100 con una desviacin
estandar de 12,5. Si se aplica la prueba a una muestra de 100 personas
seleccionadas aleatoria mente, encuentre las siguientes probabilidades:
a) P[98,5 ] 5 , 101 ) ( s s X M
b) P[96 ] 104 ) ( s s X M
c) P[M(X) >102]
d) P[M(X) <975]
2. El tiempo necesario para el mantenimiento peridico de una maquina tiene generalmente un
distribucin en forma de montaa, sesgada a la derecha, ya que ocasionalmente ocurren largos
tiempos de servicio. Suponga que el tiempo requerido para la revisin y el servicio despus de 6
meses de operacin normal, tiene una media de 1,4 horas y una desviacin estandar de 0,7


horas. Suponga que le departamento de servicio planea reparar 50 maquinas en das de 8 horas
y que para hacer esto, no puede utilizar ms de 1,6 horas en promedio por maquina. Que
proporcin de todos los das tendra que trabajar horas extras el departamento de servicio?

3. Los siguientes datos muestran las ventas en millones de pesos, realizadas en los meses de
enero a octubre de 2006, de una muestra de 28 PIMES seleccionadas al azar:
26.9 99.8 37.8 28.7 35.6
44.2 55.2 25.4 32.3 50.6
31.7 45.2 39.7 36.8 25.1
29.3 88.2 40.2 35.6 42.9
28.7 35.6 26.9 99.8 37.8
32.3 50.6 44.2
a) Cual es la probabilidad que el promedio de ventas mensual de las PIMES sea por lo menos de
35 millones de pesos?
b) Cual es la probabilidad que el promedio de ventas mensual de las PIMES este entre 30 y 40
millones de pesos?
(Sugerencia: Calcule primero la media muestral y la desviacin estandar muestral, ayudndose
con el men HERRAMIENTAS y la opcin ESTADISTICA DESCRIPTIVA.

You might also like