You are on page 1of 57

MUESTREO ALEATORIO SIMPLE

(M.A.S.)

Ramn de la Cruz Yupanqui

MUESTREO ALEATORIO
SIMPLE (M.A.S.)
Mtodo de seleccin de la muestra en un paso
El marco muestral debe ser una lista completa
Cada unidad tiene la misma probabilidad de
seleccin
Esta probabilidad es p = n/N
donde n es el tamao de la muestra
y N es el tamao de la poblacin

Cada muestra (de n) tiene la misma


probabilidad de seleccin

Muestreo Aleatorio
Simple
Poblacin N = 54 viviendas
Muestra

n = 18

Fraccin muestral p = n / N = 18 / 54 =
1/3
Cada vivienda tiene probabilidad de seleccin
1/3
Se seleccionan 18 nmeros aleatorios entre 1
y 54
Se seleccionan las viviendas correspondientes

Muestreo
Muestreo Aleatorio
Aleatorio Simple
Simple
San Jos

Av 28 de Julio

San Luis

San Pablo

San Carlos

San Ricardo

San Roberto

San Benito

Santo domingo

San Pedro

Av. circunvalacin

Muestreo
Muestreo Aleatorio
Aleatorio Simple
Simple

San Jos

Av. 28 de Julio

San Luis

San Pablo

San Carlos

San Ricardo

San Roberto

San Benito

Santo Domingo

San Pedro

Av Circunvalacin

Muestreo
Muestreo Aleatorio
Aleatorio Simple
Simple
San Jos

Av. 28 de Julio

San Luis

San Pablo

San Carlos

San Ricardo

San Roberto

San Benito

Santo Domingo

San Pedro

Av Circunvalacin

MARCO - LISTA DE CLIENTES


1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.

Cliente 1
Cliente 2
Cliente 3
Cliente 4
Cliente 5
Cliente 6
Cliente 7
Ciente 8.
Cliente 9
Cliente 10
Cliente 11
Cliente 12

.
.

etc.

42.
43.
44.

Cliente 42
Cliente 43
Cliente 44

229-4111
304-4211
556-2929
951-8925
728-4214
234-4146
279-3582
310-1010
649-1234
233-6111
298-9441
246-1389

Sr. J. Blank
Srta. F Jones
Sr. Z. Flugelheim
Sr. P. Williams
Dr. Fred Wilkins
Srta R. Hopewell
Srta B. Bradshaw
Sr. E Grant
Sr.. G Smith
Sra A Applebaum
Sr. G. Hardy
Sra. F. Fredericks

432-5699
560-1000
237-1049

Srta P Gudrunsdottir
Dr. J Gonzlez
Srta. J. Green

Muestreo Aleatorio Simple


Poblacin N = 44 clientes
Supongamos n = 11 (uno de cada cuatro)
Y los 11 nmeros aleatorios seleccionados
son:
12, 33, 5, 11, 43, 16, 36, 21, 3, 37, 29

MARCO - LISTA DE CLIENTES


1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.

Cliente 1
Cliente 2
Cliente 3
Cliente 4
Cliente 5
Cliente 6
Cliente 7
Ciente 8.
Cliente 9
Cliente 10
Cliente 11
Cliente 12

.
.

etc.

42.
43.
44.

Cliente 42
Cliente 43
Cliente 44

229-4111
304-4211
556-2929
951-8925
728-4214
234-4146
279-3582
310-1010
649-1234
233-6111
298-9441
246-1389

Sr. J. Blank
Srta. F Jones
Sr. Z. Flugelheim
Sr. P. Williams
Dr. Fred Wilkins
Srta R. Hopewell
Srta B. Bradshaw
Sr. E Grant
Sr.. G Smith
Sra A Applebaum
Sr. G. Hardy
Sra. F. Fredericks

432-5699
560-1000
237-1049

Srta P Gudrunsdottir
Dr. J Gonzlez
Srta. J. Green

Muestra aleatoria simple 1

Muestra Aleatoria Simple 2

Muestra aleatoria simple 3

Muestreo Aleatorio
Simple
Ventajas del MAS
Sencillez conceptual
Necesita como marco muestral slo una
lista de todos los elementos de la
poblacin
Es fcil calcular las estimaciones de
valores poblacionales
Es fcil calcular las estimaciones de
precisin (varianza muestral)

Muestreo Aleatorio
Simple

Desventajas del MAS

Tedioso eligir todos los nmeros aleatorios si


n es grande
No utiliza informacin auxiliar sobre la
poblacin
Necesita una lista completa de los
elementos de la poblacin
Puede tener baja precisin comparado con
otros mtodos

Muestreo Aleatorio
Simple
El MAS se puede realizar:
Con reposicin (MASCR)
Sin reposicin (MASSR)

Muestreo Aleatorio
Simple

MASCR
Seleccionar una unidad
Reemplazarla en la poblacin
Seleccionar otra, de la poblacin completa
Continuar hasta obtener una muestra de
tamao n
Se puede seleccionar la misma unidad
ms que una vez

Muestreo Aleatorio
Simple
MASSR:

Seleccionar una unidad


Sacarla de la poblacin
Seleccionar otra unidad de las que quedan y sacarla
Continuar hasta obtener n unidades distintas
Cada unidad puede estar incluida una sola vez
Es ms eficiente que el MASCR
Se usa en la prctica

Ejemplo del MAS


Encuesta de las empresas sobre
Gastos en insumos

Poblacin de seis empresas (N = 6)


Propsito: estimar gastos para
compras de insumos
Presupuesto permite slo una
muestra de dos empresas (n = 2)

Ejemplo del MAS


Poblacin completa
Empresa
1
2
3
4
5
6
Total

Gastos
$ 26,000
470,000
63,800
145,000
230,000
12,500
947,300

Muestras
posibles

Gastos
observados

(1,2)
496,000
(1,3)
89,800
(1,4)
171,000
(1,5)
256,000
(1,6)
38,500
(2,3)
533,800
(2,4)
613,000
(2,5)
700,000
(2,6)
482,500
(3,4)
208,800
(3,5)
293,800
(3,6)
76,300
(4,5)
375,000
(4,6)
157,500
(5,6)
252,500
15 muestras posibles

Estimacin
del total
1,488,000
269,400
513,000
768,000
115,500
1,601,400
1,845,000
2,100,000
1,447,500
626,400
881,400
228,900
1,125,000
472,500
727,500
promedio 947,300/6 : insesgado

MUESTREO ALEATORIO SIMPLE ( MAS )


(SIN REEMPLAZO)

El Muestreo Aleatorio Simple (MAS), es un


procedimiento de seleccin de n elementos de una
poblacin finita N; mediante el cual, cada una de las
CnN muestras distintas tienen la misma probabilidad
de salir elegidas.
Consideremos
una
muestra
de
n
unidades
especificadas. Entonces, la probabilidad de que se
extraigan las n unidades especificadas es:
n ! N n !
n
n 1
n 2
1
1
.
.
.....
.
.

N
N 2
N!
CnN
N
1
N n 1

SELECCION DE LA MUESTRA
USO DE LA TABLA DE NUMEROS
ALEATORIOS
EJEMPLO.- Seleccionar una muestra de tamao n =
20, de una poblacin de N = 275 elementos.
El procedimiento es el siguiente:
1)

Observar el nmero de dgitos que componen


el tamao poblacional ( N = 275 ). En este
caso tiene tres
dgitos.

2)

Seleccionar en la tabla, 20 nmeros de tres


dgitos menores o igual a 275. Se puede
trabajar en fila, en
columna o diagonal.

EJEMPLO
Se considera una poblacin de tamao N = 5 .
Los valores de una variable real Y sobre esta
poblacion son :
y1=8, y2=7, y3=8, y4=14, y5=13
Se obtiene: =10 (Promedio Poblacional)
y 2 =8.4 (Varianza Poblacional)
N de muestras posibles de tamao 3
N
C
es
10
n =

DIEZ MUESTRAS POSIBLES


Muestras
Posibles

valores Total Promed


io y

{y1,y2 ,y3}
{y1,y2 ,y4}

8
8

7
7

8
14

23
29

7.67
9.67

Varianza
S2
0.33
14.3

{y1,y2 ,y5}

13

28

9.33

10.33

{y1,y3 ,y4}

14

30

10

12

{y1,y3 ,y5}

13

29

9.67

8.33

{y1,y4 ,y5}

14 13

25

11.67

10.33

{y2,y3 ,y4}

14

29

9.67

14.33

{y2,y3 ,y5}

13

28

9.33

10.33

{y2,y4 ,y5}

14 13

34

11.33

14.33

{y3,y4 ,y5}

14 13

35

11.67

10.33

DISTRIBUCION DE LA
MEDIA
y
Promedio

Pi
Probabilidad

7.67

1/10

9.33

2/10

9.67

3/10

10.00

1/10

11.33

1/10

11.67

2/10

Clculo de Esperanza y
Varianza de la media muestral
E( yY) = ((7.67)(1) + (9.33)(2) + (9.67)(3) + (10)(1)
+ (11.33)(1) + (11.67)(2)) / 10 = 100.01 / 10 = 10
y

Luego: E( y ) = 10
V( y ) = .54289 + .08978 + .03267 + .0 + .17689 + .55778
=1.4
Luego: V( y ) = 1.4

FORMULAS DE CALCULO DIRECTO


E( y ) =

pero la : = 10
2 = 8.4
N=5

2 = (N 1/ N) S2

S2 = 10.5

2 N n 2 N
1 f
V Y

n N 1
n N 1

V (y ) = 1.4

n = 3

Intervalos de Confianza
Para cada una de las 10 muestras,
aunque no se verifiquen las
condiciones para el uso de la ley
normal, calculamos el intervalo de
confianza:

s
y 1.96
n

1 f

Muestras
{y1,y2,y3}

INTERVALOS DE
CONFIANZA
2
S
Intervalos
y
7.67

0.33

7.67 + 0.41

[7.26 ; 8.08]

{y1,y2,y4}

9.67

14.33

9.67 + 2.71

[6.96 ; 12.34]

{y1,y2,y5}

9.3

10.33

9.33 + 2.30

[7.03 ; 11.63]

{y1,y3,y4}

10

12

10

[7. 52 ; 12.48]

{y1,y3,y5}

9.67

8.33

9.67 + 2.07

[7.6 ; 11.74]

{y1,y4,y5}

11.67

10.33

11.6 + 2.3

[9.37 ; 13.97]

{y2,y3,y4}

9.67

14.33

9.67 + 2.71

[6.96 ; 12.34]

{y2,y3,y5}

9.33

10.33

9.33 + 2.3

[7.03 ; 11.63]

{y2,y4,y5}

11.33

14.33

11.3 + 2.71

[8.66 ; 14.04]

{y3,y4,y5}

11.67

10.33

11.6 + 2.3

[9.37 ; 13.97]

+ 2.48

ESTIMADOR DE LA MEDIA POBLACIONAL - MAS


Sea { x1 , x2 , x3 ,..........,xn } una muestra aleatoria de tamao n, extrada de una poblacin finita de N elementos, entonces:

x
X

x
i 1

MEDIA
MUESTRAL

Es el estimador de la media poblacional


F

N
: Factor de Expansin
n

1 n
: factor de muestreo o tasa muestral
F N

VARIANZA DE LA MEDIA MUESTRAL - MAS


Primero se definen la cuasivarianza y la varianza
poblacionales:
N

Cuasivarianza
Poblacional
S2

Varianza
Poblacional

X
i 1

N 1

Xi
i 1

2
S
N 1

2

N

Por otro lado, en el Muestreo Aleatorio Simple


sin reposicin la varianza de la media muestral
est dada por:

2 N n
V (x )

n N 1

S 2 N 1 N n
S 2
n
V (x )

1
Nn
n
N 1
N
2

S
V (x ) 1 f
n
n
donde: f
N

es la tasa muestral o fraccin de mues

S
x V (x )
n

1 f

Estimador
del
Error
de
muestreo Error Estndar de
la media muestral

n
donde: f
N
muestreo

Error de muestreo
Error Estndar de la
media muestral

x V
1 f
V((xx))
n

es la tasa muestral o fraccin de

En la prctica, el cpf se puede ignorar siempre y


f 5%
cuando
la fraccin de muestreo no exceda un 5%; es
decir, siempre que
.

INTERVALO DE CONFIANZA PARA


LA MEDIA POBLACIONAL

ks

ks

P[ x
1 f x
1 f ] 1
1 44 n2 4 43
1 44 n2 4 43

inferior
Lmite
de confianza

b
superior
Lmite
de confianza

K : Abscisa de la Distribucin Normal (curva de Gauss)


1 : Nivel de confianza

ESTIMADOR DEL TOTAL POBLACIONAL - MAS


Sea { x1 , x2 , x3 ,..........,xn } una muestra aleatoria de tamao n, extrada de una poblacin finita de N elementos, entonces:

x
X NX
n

xi

i 1

Es el estimador
del total poblacional
x
N
F : Factor de Expansin
n
1 n
f : factor de muestreo o tasa muestral
F N

VARIANZA DEL ESTIMADOR DEL


TOTAL POBLACIONAL
En el Muestreo Aleatorio Simple sin reposicin la varianza
del Estimador del Total Poblacional est dada por:

N 2S 2

1 f
n

N s
x V ( x )
n

1 f

N s

x V ( x )
1 f
n
n
donde: f
N

Error de muestreo del


Estimador del Total
Poblacional

Estimador
Error
de
muestreo del Estimador
del Total Poblacional

es la tasa muestral o fraccin de muest

INTERVALO DE CONFIANZA PARA


EL TOTAL POBLACIONAL

Nks

P[ Nx
1 f
1 4 4 2n 4 4 3

donde :

Nks
n

Nks

Nx
1 f ] 1
1 4 4 2n 4 4 3

Lmite inferior
de confianza

b
superior
Lmite
de confianza

1 f error de estimacin (mximo)

ESTIMACION DEL TAMAO DE MUESTRA - MAS


VARIABLES CUANTITATIVAS

Elementos para calcular un tamao de muestra


1. Informacin anterior de promedios y varianzas de variables
relacionadas con la investigacin (Censos, encuestas,
pilotos).
2. Elegir un nivel de confianza
( 90%, 95%, 99%) . Generalmente
para estudios macroregionales,
regionales, locales se elige 95%.
Es decir: Z = K =
1.96 (abscisa de la distribucin
Normal)
3. Decidir sobre el margen de error (e ) que estamos dispuestos
a tolerar (Error mximo permisible = Error Absoluto
aceptado).

( e=d.

Donde : d = Error Relativo Aceptado).

4. Tamao de la Poblacin ( N )

ESTIMACION DEL TAMAO DE MUESTRA - MAS


VARIABLES CUANTITATIVAS

P x Z x 1
x

Z x

Z x

Frmula para estimar el


tamao de la muestra (M.A.S.)
no
n
no
1
N

, donde : no

2 2

ZS

e = Margen de error. Es el error absoluto


del Promedio Poblacional ( e = d . )
d = Es el error relativo aceptado (precisin)

Ejemplo: Clculo de tamao

de muestra
Se quiere estimar la edad promedio
de 2,500 (N) estudiantes del ltimo
ao en una universidad. Cul debe
ser el tamao de la muestra (n) si
queremos estimar dicha variable
con un error no mayor a 2 aos y
con un nivel de confianza de 95% ?
Supongamos que S = 30.

Ejemplo: Clculo de tamao


de muestra

n0 =
Z2 . S2
e2

n0 =

(1.96)2. (30)
(2)2

29 alumnos

Reemplazando en la
frmula general:

n =

115.248
4

n0
1 + n0 / N

n=

29

1 + .0116
El tamao de muestra de alumnos debe ser de
29

= 29

MUESTREO ALEATORIO PARA PROPORCIONES


VARIABLES CUALITATIVAS O DE ATRIBUTOS
POBLACI
N (N)

NX

X
Proporcin poblacional
N

Nmero de elementos en la poblacin, que tienen


alguna caracterstica o atributo, o que caen dentro
de alguna clase.
n
Proporcin muestral:

Estimador del Total de


Clase Poblacional

xi
i 1

X N p

ESTIMADOR DE
LA PROPORCION
POBLACIONAL

VARIANZA DE LA PROPORCION Y DEL TOTAL DE CLASE


MUESTRALES - MAS

En el muestreo aleatorio sin reposicin las varianzas de


la
Proporcin muestral y del Estimador del Total de Clase
estn dadas respectivamente por:
VARIANZA DE LA
PROPORCION
MUESTRAL

VARIANZA DEL
ESTIMADOR DEL
TOTAL DE CLASE

PQ N n
V ( p )

n N 1

p q N n

V p

n N 1

2
N
PQ N n

V X

n N 1

p q N n
V X N 2

n N 1

n
donde: f es la tasa muestral o fraccin de muestreo
N

INTERVALO DE CONFIANZA PARA LA


PROPORCION POBLACIONAL - MAS

p q N n
p q N n
P p Z

P p Z

1
n N 1
n
N 1

1 4 4 42 4 4 43
1 4 4 42 4 4 43

superior
Lmite
de confianza

Lmite inferior de confianza


1

: Nivel de Confianza

INTERVALO DE CONFIANZA PARA EL


TOTAL DE CLASE POBLACIONAL-

MAS

p q N n
P N p Z N


n N 1

14444
4 2 4 4 4 443

p q N n
N p Z N

1
n
N 1
14444
4 2 4 4 4 443

Lmite inferior de confianza


donde : NZ

superior
Lmite
de confianza

p q N n

error de estimacin
n N 1

ESTIMACION DEL TAMAO DE MUESTRA - MAS


(VARIABLES CUALITATIVAS O DE ATRIBUTOS)

PQ N n
Tenemos que: P p P Z


n N 1

Tal que, el error de estimacin no debe ser mayor que un


valor dado e
ACEPTADO):

( ERROR MAXIMO PERMISIBLE O ERROR ABSOLUTO

Z p e Z e
2

2
p

PQ N n
2
Z


n
N

no
n
2
Z
1 no 1 , donde : no PQ
e = d.P
2
e
d = error relativo
N

aceptado (precisin)

EJEMPLO :
Una empresa va a realizar un estudio de mercado
antes de lanzar un nuevo producto hacia una poblacin
de 30,000 consumidores. Una encuesta piloto previa
al estudio, revel que el 60 % de los consumidores
prefieren su producto.
a)Qu tamao de muestra deber escoger si quiere
tener una confianza del 95% de que el error de
estimacin de la proporcin a favor del producto no sea
superior
p 0.7 a 2.12 % ?.
b) Si con el tamao de muestra estimado en (a), se
utiliza
,
como estimacin de la proporcin de
todos los
consumidores que prefieren su producto.
Qu grado de confianza utiliz si estim de 19,710 a

a)

ESTIMACION DEL TAMAO DE MUESTRA (PROPORCIONES)

N 30000

P 0.60

e 0.0212

no
Z 2 PQ
n
, donde : no
2
n

1
e

1 o
N
no

Z 2 PQ

1.96 0.6 0.4

2
0.0212

1 95% z 1.96

e = d.P
d = precisin

2051.41

no
2051.41

1920.17
no 1
2050.41

1
1
N
30000

n 1920

b)

INTERVALO DE CONFIANZA (PROPORCIONES)

p 1 p N n

0.01012
n
N 1

P p z p p p z p 1

Pero

X
p
P N p z p X N p z p 1
1 4 2 4 3
14243
N
19710
22290

N p z p 22290

30000 0.7 + z 0.01012 22290


z 4.24976 1 99.99%

ERROR RELATIVO ACEPTADO

COEFICIENTE
DE VARIACIN

PRECISION

NIVEL DE CONFIANZA: (1 )
MODELO
Error Mximo DE
Z = 1.645
Z = 1.96
Z = 2.38
Permisible (%)
MATRIZ PARA
90%
95%
98%
d
ESTIMAR EL
TAMAO DE
MUESTRA
10%
74
7%
152
5%
296
1%
890

ERROR RELATIVO ACEPTADO

COEFICIENTE
DE VARIACIN

PRECISION

NIVEL DE CONFIANZA: (1 )
MODELO
Error Mximo DE
Z = 1.645
Z = 1.96
Z = 2.38
Permisible (%)
MATRIZ PARA
98%
90%
95%
d
ESTIMAR EL
TAMAO DE
MUESTRA
10%
53
74
105
7%
107
152
214
5%
210
296
418
2%
325
890
1370

EJERCICIOS DE M.A.S.
1. Un importador va a recibir un lote de 10,000 artculos que
vienen encajonados (cada caja tiene 20 artculos) antes de
recibir el lote se decide hacer una inspeccin por
muestreo para determinar el porcentaje de defectuosos.

Poblacin objetivo = lote de 10,000 artculos


Un elemento = un artculo de la poblacin
Medicin = calidad del artculo: defectuoso / no defectuoso
Caractersticas de inters = Calidad (medicin numrica
Marco Muestral = listado de las cajas de artculos que
componen el lote
Unidad de muestreo = Caja de artculos
Unidad de Observacin = Un artculo
Unidad que reporta = inspector o perito
Tamao poblacional = nmero de artculos que conforman el
lote
Muestra = una o mas unidades seleccionadas del marco
muestral ( una o mas cajas).
Tamao de la muestra = nmero de cajas seleccionadas
Parmetro desconocido = proporcin de artculos defectuosos
en el lote.

2. Una muestra aleatoria simple de 100 medidores de agua es


controlada dentro de una comunidad para estimar el consumo
medio diario de agua por casa (en litros), durante un periodo
estacional seco. La media muestral fue de 12,5 litros y la
cuasi-varianza muestral de 1252. Si suponemos que hay
10.000 casas dentro de la comunidad, estime el consumo
medio diario verdadero, y establezca un lmite para el error de
estimacin.
3. Usando los datos del ejercicio 2, estime el nmero total de
litros de agua usado diariamente durante el periodo seco.
Establezca un lmite para el error de estimacin.
4. Una muestra aleatoria simple de 40 estudiantes fue
entrevistada para determinar la proporcin de estudiantes que
est a favor del cambio del sistema cuatrimestral al anual.
Veinticinco de los estudiantes respondieron afirmativamente.
Estime la proporcin de estudiantes que est a favor del
cambio (suponer N =2000). Establezca un lmite para el error
de estimacin.

5.

Un dentista est interesado en


la efectividad de una nueva
pasta dental. Un grupo de
1000 nios de escuela
particip en el estudio. Los
registro de un estudio anterior
mostraron que haba un
promedio de 2,2 caries cada
seis meses para el grupo.
Despus de tres meses de
iniciado el estudio, el dentista
muestre 10 nios para
determinar cunto haban
progresado con la nueva pasta
dental. Usando los datos de la
siguiente tabla, estime el
nmero medio de caries para
todo el grupo, y establezca un
lmite para el error de
estimacin.

Nio

N de caries en tres meses

10

6.

7.

Un psiclogo desea estimar el tiempo de reaccin medio para


un estmulo entre 200 pacientes de un hospital especializado en
trastornos nerviosos. Una muestra aleatoria simple de 20
pacientes fue seleccionada, y fueron medidos sus tiempos de
reaccin, con los resultados siguientes: Media Muestral=2,1
segundos y Cuasidesviacin tpica muestral = 0,4 segundos.
Estime la media poblacional y establezca un lmite para el error
de estimacin.
En una poblacin de 10,000 viviendas se obtuvo una muestra
aleatoria simple de n = 11 viviendas con el siguiente nmero de
personas: 2, 3, 6, 1, 4, 3, 8, 2, 2, 1, 1.
Estimar el nmero de personas por vivienda y su error de
muestreo.
Construir el intervalo de confianza del 95% para el nmero de
personas por vivienda en la poblacin.

8.

9.

10.

Se desea disear una encuesta de hogares para estimar el promedio anual de


ingresos por hogar. El nmero de hogares es igual a 2000,000. Basado en
los datos obtenidos de un censo previo, se sabe que la varianza poblacional
para esta variable es igual a 1000,000 ( o sea S=1000).
a). Qu tamao de la muestra es necesario para estimar el ingreso con un
nivel de confianza del 95% y del manera que la estimacin tenga un error
no menor a 100.
b). Y si el error no fuera mayor de 50?
En un rea existen N = 10,000 viviendas. Los datos de un censo anterior
hacen suponer, aproximadamente, los 2/3 corresponde a rgimen de
alquiler.
Se pide calcular el tamao de la muestra necesario para estimar la
proporcin actual de viviendas en alquiler, con un error de muestreo igual a
0.04.
Queremos estimar la edad promedio de 3,000 estudiantes del ltimo ao en
la universidad . Cuan grande debe ser la muestra si queremos estimar
dicha variable con un error no mayor a 2 aos y con un nivel de confianza
del 95%. Supongamos que S2 = 30 e ignoremos el fpc.

You might also like