You are on page 1of 45

UNIVERSIDAD NACIONAL DEL ALTIPLANO

FACULTAD DE INGENIERIA ECONOMICA

UN IVERS IDAD
A LT I P L A N O

TCNICAS DE MUESTREO
M.Sc. Sabino Edgar Mamani Choque
El objetivo del muestreo es contar con el mayor nmero de
unidades, can la mayor cantidad de informacin, pero al
menor costo posible. Para el diseo de la muestra y clculo
del tamao se debe considerar lo siguiente:

1. Planteamiento del problema. Determinar con claridad la


necesidad de realizar un trabajo de investigacin, para lo
cual se debe revisar toda la informacin necesaria que
permita conocer con mayor profundidad el problema.
2. Establecer el (los) objetivos de manera clara y precisa,
los mismos que no se deben perder de vista a lo largo
del proceso de investigacin.

3. Determinar la poblacin objetivo, que debe estar


claramente definida y plenamente identificada al inicio
del proceso de seleccin y entrevista. Significa
identificar la unidad o el elemento en forma clara,
mensurable, adecuada y comparable.
4. Formulacin de hiptesis. Ejemplos: Se observan
variaciones en las cantidades consumidas, frente a
variaciones de precios y marcas; El consumo de ... es bajo en
comparacin con el mnimo nutricional recomendable.

5. Elaboracin del marco de referencia, que es un listado de


todas las unidades que constituyen la poblacin objetivo, y
deben estar relacionados con un mapa o croquis que indique
la localizacin de las unidades.
Poblacin. Conjunto total de individuos o
elementos objeto de una investigacin.
Debe estar definido en trminos de:
Caractersticas fsicas
Cobertura (geogrfica o institucional)
Tiempo.

Muestra. Cualquier sub conjunto de la poblacin en


referencia
Muestras determinsticas (no expandible)
Muestras probabilsticas (teora de muestreo)
Probabilidad de seleccin.
Valor entre 0 y 1 que mide la posibilidad de que un
elemento de la poblacin pertenezca a la muestra.

Parmetro.
Expresin numrica que sintetiza los valores de una
caracterstica de la poblacin en estudio.
La media
La varianza 2
La proporcin P
Estimador.
Valor aproximado del parmetro y se obtiene de la
informacin recolectada en la muestra.
La media muestral X
La varianza muestral S2
La proporcin muestral p

Alternativas para estudiar una poblacin


Sondeos. Mtodo para caracterizar sistemas, identificar situacin de productores
Censos
Muestreos
Ventajas del muestreo
Costo
Oportunidad Rapidez tiempo
Precisin
Estudios en el tiempo
Profundidad de temas
Procesamiento y produccin de resultados
Inferencia

Desventajas.
Identificacin individual
Fenmenos de baja frecuencia
Muestreo de elementos
El elemento o individuo es la unidad de muestreo.
El marco de referencia es la lista de los elementos como base
para la seleccin de la muestra.
No es recomendable en poblaciones muy grandes.

Problemas de marco de referencia.


Elementos faltantes Cobetura
Elementos duplicados
Elementos extraos
Tamao ptimo de la muestra (n).

Debe ser pequea para que el costo de la investigacin

se suficientemente bajo, y bastante grande para que el

error de muestreo sea admisible.


Componentes en el proceso de clculo (factores determinantes).

a. Error muestral (E).


Diferencia entre le valor poblacional
(parmetro) y la estimacin de la misma
(estimador), obtenida por muestra aleatoria.

E = X -
=XE

En muchos casos el error es determinado por el


investigador, y requiere conocimiento sobre las
caractersticas de la poblacin en estudio.
Resulta prctico determinar el error como un porcentaje
(la mayora de la veces no mayor del 10%) respecto de la
media aritmtica E = (%) ().

El porcentaje podra considerarse como complemento


del nivel de confianza: una confianza del 95% dara
supuestamente un error del 5%.
Pero no siempre debe ser el complemento, porque
depender del grado de precisin con que se desea
hacer la estimacin.
Existe otro tipo de error ajeno al muestreo: medicin incorrecta,
cuestionarios mal definidos, errores del entrevistador en preguntas
/ interpretacin de respuestas, etc.
b. La varianza.
El tamao de la muestra depende en gran
medida de la variabilidad (ejemplo, muestreo de
sangre, fumadores).

Cuando no se conoce la varianza (no existe


informacin sobre la poblacin) se debe realizar
una encuesta piloto, cuyo tamao lo fija el
investigador (arbitrario; ejm. 5%) en base al
tamao de la poblacin, tiempo y costo.

Permite determinar fallas de encuesta, familiaridad con


encuestas, tiempo de entrevista, etc
Importancia del formato de encuesta
c. Nivel de confianza
Fijado por el investigador. Generalmente se trabaja con Z=1.96
correspondiente a un nivel de confianza del 95.%. Otros valores:

Valor de Z Nivel de confianza (%)


1.64 90
2.00 95.5
2.57 99
MUESTREO ALEATORIO SIMPLE

Tcnica sencilla y conocida


Aplicable en poblaciones homogneas
Tcnica complementaria en otros diseos
La poblacin debe estar enumerada o codificada
consecutivamente
Seleccionar n elementos aleatoriamente
Probabilidad de seleccin f = n / N
Ejemplo.

El proceso de planificacin de una regin ganadera requiere de


diferentes trabajos de investigacin. Cuenta con una poblacin de
2,500 productores. Determine el tamao ptimo de muestra sobre
la base de: a) nmero de vacas lecheras por hato, b) el
rendimiento promedio de leche por hato, c) la proporcin de
hatos con un rendimiento promedio mayor a 250 litros; para todos
los casos considere un error del 7% y un nivel de confianza del 99%.
Los resultados de una encuesta preliminar de tamao 50,
fueron los siguientes:
a) Promedio de vacas por hato, 25 y desviacin
estndar, 18.
b) Rendimiento promedio del leche por hato, 225 litros y
varianza 4,225.
c) 70% de los hatos tienen rendimiento promedio mayor
a 250 litros.

Cual es el n optimo ?
a) Promedio de vacas por hato:

: 25
D.E : 18
N : 2,500
Error : 7%
P : 99% , asociado a un valor Z = 2.57
n1 : 50
E = 0.07 x 25 = 1.75

22 2 0
0 = 2 1 + = 0
1 1+

2.572 324 2
0 = 1+ = 726.72
1.752 50

726.72
= = 563.72
726.72
1+
2500
b) Rendimiento promedio de leche por hato.

: 225
S2 : 4225
N : 2,500
Error : 7%
P : 99% esta asociado a un valor Z = 2.57
n1 : 50
E = 0.07 x 225 = 15.75

2.572 4225 2
0 = 1+ = 116.99
15.752 50

116.99
= = 111.76
116.99
1+
2500
c) 70% de los hatos tienen rendimiento promedio
mayor a 250 litros

P = 0.7, Q = 0.3
2 : PQ = 0.7 x 0.3 = 0.21

N : 2,500
Error : 7%
P : 99% , asociado a un valor Z = 2.57
n1 : 50
2
2
0 = 2
1+
1

0
= 0
1+

2.572 0.21 2
0 = 1+ = 294.39
0.072 50

294.39
= = 263.38
294.39
1+
2500

Si la investigacin de la ganadera en la mayora


de aspectos, el n optimo es (a).

Si E y P toman otros valores?


Muestreo Aleatorio Simple

Cuando no se conoce la varianza poblacional


(es muy frecuente)

Se debe tomar en cuenta las investigaciones similares


realizadas con anterioridad, de lo contrario
realizar encuesta preliminar (piloto).
Ejemplo.
N = 300 familias
Error 5%
P : 99% esta asociado a un valor Z = 2.57
n se puede determinar de tres formas:

a). b). =
2 2
.
22 2 + 2 2
0 = .
2

0
= 2

1+ 0 c). =
2 + 2
Encuesta piloto (5% de la poblacin)
npiloto = 0.05(300) = 15
Resulatdos de encuesta piloto
Ingreso Vivienda Nmero total Con Consumo diario
No. (S/.) propia de personas M F empleo de carne (gr)
1 850 Si 4 2 2 1 750
2 260 Si 4 1 3 1 745
3 990 Si 3 2 1 2 490
4 810 No 4 2 2 1 470
5 390 No 6 3 3 3 550
6 870 Si 5 2 3 2 580
7 670 Si 2 1 1 1 590
8 355 No 3 1 2 1 500
9 680 Si 2 1 1 1 520
10 385 Si 2 1 1 1 480
11 335 No 2 1 1 2 440
12 620 Si 5 2 3 2 680
13 780 Si 4 2 2 1 780
14 605 No 3 1 2 2 820
15 675 Si 3 2 1 1 600
Promedio 618.33 p=10 599.67
Desv. Est. 225.59 q=5 125.11
a). Basado en el ingreso.

a.1

E = 0.05 (618.33) = 30.92

2.572 50890.85
0 = 2
= 351.58
30.92

351.58
= = 161.87 162
351.58
1+
300
a). Basado en el ingreso.

a.2
300 2.57 2 50890.85
= 2 2
= 161.87 162
300 30.92 + 2.57 50890.85

a.3
50890.85
= 2 = 161.87 162
30.92 + 50890.85 300
2.57

Nota. El coeficiente de variabilidad para esta variable es :

CV = S/X = (225.59/618.33)x100 = 36.48%


b). Basado en el consumo promedio de carne
por da por familia.

E = 0.05 (599.67) = 29.98


n= NZ2S2 .
NE2 + Z2S2

300 2.572 15652.51


= 2 2
= 83.14
300 29.98 + 2.57 15652.51

Nota. El coeficiente de variabilidad para esta variable es :

CV = S/X = (125.11/599.67)x100 = 20.86%


c) Basado en la proporcin de familias con
vivienda propia.
Con vivienda propia 10,
P = 10 / 15 = 0.67 Q = 5/15 = 0.33
Sp2 = PQ = 0.67 (0.33) = 0.2211

n= NZ2 PQ .
NE2 + Z2 PQ

300 2.572 0.2211


= 2 2
= 198.21
300 0.05 + 2.57 0.2211
Muestreo Aleatorio Estratificado.
Cuando la caracterstica que se investiga tienen alta
variabilidad

Este tipo de muestreo permite:


a. Mayor precisin de los estimadores, pese a que el
nmero de unidades seleccionadas es menor respecto
del M.A.S.
b. Garantiza la representatividad y una reduccin del
error de la muestra, por agrupacin de elementos que
se parecen mas por caracterstica que se investiga que
por pertenecer a la poblacin.
c. Agrupar a la poblacin por estratos homogneos,
pero heterogneos entre estratos.
Simbologa.

N : Poblacin

Nh : Poblacin de cada estrato.

h : Identifica a cada estrato h = 1,2, ...

Nh = N = N1 + N2 + ... NM

: Media aritmtica poblacional de cada estrato

: Media aritmtica poblacional ponderada por estrato


= =

Wh : Proporcin de elementos en cada estrato

Wh = Nh / N

Wh = W1 + W2 + ... WM = 1

2 : Varianza poblacional en cada estrato

2

2 =
1

n : No. de unidades de la muestra total

ni : No. de unidades de la muestra en cada estrato


a). Asignacin igual.
Ejemplo.
Estrato I Ingresos menores a S/ 850 N1 250 familias
Estrato II Ingresos entre S/851 y S/ 1700 N2 180 familias
Estrato III Ingresos mayores a S/1700 N3 70 familias
N 500 familias

Proporcin de unidades en cada estrato:

Estrato I N1 = 250 W1 = N1/N W1 = 250/500 = 0.50


Estrato II N2 =180 W2 = N2/N W2 = 180/500 = 0.36
Estrato III N3 = 70 W3 = N3/N W3 = 70 /500 = 0.14
N = 500
Encuesta piloto al 4% de la poblacin:

npiloto = 0.04 (500) = 20 familias

nh = npiloto / L = 20/3 = 6.67 7

donde L : Nmero de estratos

n1 = n2 = n3 = 7 npiloto = 21 familias
Resultados de encuesta piloto.

Media aritmtica Desviacin estndar Varianza

_
X1 = 420 S1 = 133.90 S12 = 17,929.21
_
X2 = 695 S2 = 25.40 S22 = 645.16
_
X3 = 1100 S3 = 165.50 S32 = 27,390.25
Media aritmtica ponderada por estrato.
= = (0.50 x 420) + (0.36 x 695) + ( 0.14 x 1,100) = 614.20

Error = 7% de Xst
E = 0.07 (614.2) = 42.99

P = 99%, nivel de confianza (Z=2.57)

Se puede determinar de dos formas:


a. n0 = (1/V) WhSh2

donde V = (E/Z)2

0
0 = 0
1+

b.
2 2
=
2 + 2 2
a. V = (42.99/2.57)2 = 279.81

n0 = (1/279.81) [ (0.5 x 17,929.21) + (0.36 x 645.16) + ( 0.14 x 27,390.25) ] = 46.57

n= 20.38 . = 42.60 43
1 + (20.38/500)

b.
n= 500(2.572) [ (0.5 x 17929.21) + (0.36 x 645.16) + (0.14 x 27390.25)] .
500(42.992) +2.572 [ (0.5 x 17929.21) + (0.36 x 645.16) + (0.14 x 27390.25)]

. n = 42.60 43
Asignacin igual
nh = n / 3 = 43 / 3 = 14.3 familias por estrato

Asignacin proporcional
n1 = nW1 = 43 (0.50) = 21.5 22 familias
n2 = nW2 = 43 (0.36) = 15.5 16 familias
n3 = nW3 = 43 (0.14) = 6.02 6 familias
n = 44 familias
Determinacin de n en base a proporciones.

Ejemplo.
En base a la informacin anterior y:

Estrato I N1 = 250 W1 = 0.50


Estrato II N2 = 180 W2 = 0.36
Estrato III N3 = 70 W3 = 0.14
N = 500
Error 9%
P = 99%, nivel de confianza (Z = 2.57)
Se conoce que la proporcin de familias con
vivienda propia en cada estrato es:
Encuesta piloto = 18 familias
P1 = 3/6 = 0.50 Q1 = 0.50
P2 = 4/6 = 0.67 Q1 = 0.33
P3 = 5/6 = 0.83 Q1 = 0.17

2
=
2 + 2

n = 500(2.572) [ (0.5 x 0.5 x 0.5) + (0.36 x 0.67 x 0.33) + ( 0.14 x 0.83 x 0.17)] .
500 (0.092) + 2.572 [(0.5x0.5x0.5) + (0.36 x 0.67 x 0.33) + ( 0.14 x 0.83 x 0.17)]

n = 133.94 134
Asignacin igual
n1 = n2 = n3 = n / L = 134 / 3 = 45 n = 135

Asignacin proporcional.

n1 = n W1 = 134 (0.50) = 67
n2 = n W2 = 134 (0.36) = 48.24 48
n1 = n W1 = 134 (0.14) = 18.76 19

n = 134 familias

You might also like