You are on page 1of 39

Semana 4

Gabriel Cornejo
• ¿Por qué es necesario hacer muestreo?
• Población y muestra.
• Unidad de análisis.
• Población objetivo.
• Muestreo
• Muestreo probabilístico
• Muestreo no probabilístico
• Tamaño de la muestra

Semana 4.
• Proporción
• Promedio
Semana 4

El muestreo estadístico

Semana 4.
Semana 4.
o Es muy caro acceder a toda la población.
o No hay tiempo para recolectar datos de toda la población.
o Es imposible acceder a toda la población.
o Se destruye el sujeto de análisis.

Semana 4.
Aquí el interés se centra en “qué o quiénes”, es decir, en los
participantes, objetos, sucesos o comunidades de estudio (las unidades
de análisis), lo cual depende del planteamiento de la investigación y de
los alcances del estudio.

Semana 4.
Por tanto, para seleccionar una muestra, lo primero que hay
que hacer es definir la unidad de análisis (individuos,
organizaciones, periódicos, comunidades, situaciones,
eventos, etc.). Una vez definida la unidad de análisis se
delimita la población.
Para el proceso cuantitativo la muestra es un subgrupo de
la población de interés sobre el cual se recolectarán datos, y
que tiene que definirse o delimitarse de antemano con
precisión, éste deberá ser representativo de dicha

Semana 4.
población.
Semana 4.
El principal interés es que la muestra sea estadísticamente
representativa.

Semana 4.
Una vez que se ha definido cuál será la unidad de análisis,
se procede a delimitar la población que va a ser estudiada y
sobre la cual se pretende generalizar los resultados.
Así, una población es el conjunto de todos los casos que
concuerdan con una serie de especificaciones.

Semana 4.
Marco Muestral
La muestra es, en esencia, un subgrupo de la población.
Digamos que es un subconjunto de elementos que
pertenecen a ese conjunto definido en sus características al
que llamamos población.

Semana 4.
Semana 4.
Básicamente categorizamos las muestras en dos grandes
ramas:
o las muestras no probabilísticas y
o las muestras probabilísticas

En las muestras probabilísticas todos los elementos de la


población tienen la misma posibilidad de ser escogidos y se
obtienen definiendo las características de la población y el
tamaño de la muestra, y por medio de una selección
aleatoria o mecánica de las unidades de análisis.

Semana 4.
Básicamente categorizamos las muestras en dos grandes
ramas:
o las muestras no probabilísticas y
o las muestras probabilísticas

En las muestras no probabilísticas, la elección de los


elementos no depende de la probabilidad, sino de causas
relacionadas con las características de la investigación o de
quien hace la muestra.

Semana 4.
o La muestra de participantes voluntarios.
A esta clase de muestra también se le puede llamar
autoseleccionada, ya que las personas se proponen como
participantes en el estudio o responden activamente a una
invitación.
o La muestra por conveniencia.
Es probablemente la técnica de muestreo más común. Las
muestras son seleccionadas porque son accesibles para el
investigador. Los sujetos son simplemente son elegidos

Semana 4.
porque son fáciles de reclutar.
o La muestra por cuotas.
Este tipo de muestra se utiliza mucho en estudios de
opinión y de marketing. Por ejemplo, los encuestadores
reciben instrucciones de administrar cuestionarios a
individuos en un lugar público, al hacerlo van conformando
o llenando cuotas de acuerdo con la proporción de ciertas
variables demográficas en la población.
Así, en un estudio sobre la actitud de la ciudadanía hacia un
candidato político, se dice a los encuestadores “que vayan a

Semana 4.
determinada comuna y entrevisten a 150 personas adultas,
en edad de votar. Que 25% sean hombres mayores de 30
años, 25% mujeres mayores de 30 años, 25% hombres
menores de 25 años y 25% mujeres menores de 25 años”
o La muestra bola de nieve.
Se lleva a cabo generalmente cuando hay una población
muy pequeña.
En este tipo de muestreo, el investigador le pide al primer
sujeto que identifique a otro sujeto potencial que también
cumpla con los criterios de la investigación.

Semana 4.
Se emplean, de conformidad con su uso para poblaciones
homogéneas:
o Muestreo Aleatorio Simple (MAS),
o Muestreo sistemático;

y para poblaciones heterogéneas:


o Muestreo estratificado
o Muestreo por conglomerados.

Semana 4.
Es uno de los métodos más sencillos y se considera el más
utilizado. Su característica principal es que todas las
unidades del universo o población tienen la misma
posibilidad de ser incluidas en la muestra.
En este tipo de muestreo hay varias técnicas para su
realización. Una de las ellas es la de las balotas o la lotería.
Para esta técnica es necesario contar con un listado
completo de las unidades de la población.

Semana 4.
Este procedimiento de selección es muy útil e implica elegir
dentro de una población N un número n de elementos a
partir de un intervalo K.
Este último (K) es un intervalo que se va a determinar por el
tamaño de la población y el tamaño de la muestra.
De manera que tenemos que K = N/n, en donde K = un
intervalo de selección sistemática, N = la población y n = la
muestra.

Semana 4.
Supongamos que se quiere hacer un estudio que pretende medir la
calidad de la atención en los servicios proporcionados por los médicos y
las enfermeras de un hospital. Para tal efecto consideremos que los
investigadores consiguen grabaciones de todos los servicios efectuados
durante un periodo determinado.
Supongamos que se hayan filmado 1548 servicios (N). Con este dato se
procede a determinar qué número de servicios necesitamos analizar
para generalizar a toda la población nuestros resultados.
Supongamos que la muestra debe ser (308) servicios para evaluar (con
un error máximo de 5%, nivel de confianza de 95% y un porcentaje
estimado de 50% para la muestra [p = 0.5]).

Semana 4.
El intervalo igual a 5 indica que cada cinco servicios, se seleccionará
uno hasta completar n = 308.
En ocasiones el interés del investigador es comparar sus resultados
entre segmentos, grupos o nichos de la población, porque así lo señala
el planteamiento del problema.
Por ejemplo, efectuar comparaciones por género (entre hombres y
mujeres), si la selección de la muestra es aleatoria, tendremos unidades
o elementos de ambos géneros, no hay problema, la muestra reflejará a
la población.
Se necesita una muestra de 4 individuos
8= 13 =
8= 3=

Semana 4.
La muestra
no refleja la
población.
Una muestra aleatoria estratificada es aquella que divide la población,
primero en estratos adecuados (subgrupos) y, luego, de cada estrato
selecciona una muestra aleatoria.
Este muestreo se caracteriza por la subdivisión de la población en
subgrupos o estratos, porque las variables principales que deben
someterse a estudio presentan cierta variabilidad o distribución
conocida, que se debe tomar en cuenta para extraer la muestra.
Los estratos tienen la característica que son homogéneos en su interior
pero heterogéneos entre sí.

Semana 4.
Ahora supongamos que pretendemos realizar un estudio con
directores de recursos humanos para determinar su ideología y
políticas respecto a cómo tratan a los colaboradores de sus empresas.
Imaginemos que nuestro universo es de 1176 organizaciones con
directores de recursos humanos.
Se ha determinado que el tamaño de la muestra necesaria para
representar a la población es de n = 298 directivos.
Imaginemos que uno de los atributos que debe aparecer en el estudio
es el giro de la empresa.
Lo que aquí se hace es entonces dividir a la población en

Semana 4.
subpoblaciones o estratos, y se selecciona una muestra para cada
estrato.
18,3%
Afijación
proporcional

Semana 4.
4,3%
Este tipo de muestreo se utiliza principalmente cuando no se dispone
de una lista detallada y enumerada de cada una de las unidades que
conforman el universo (población), y resulta muy complejo elaborarla.
En algunos casos en que el investigador se ve limitado por recursos
financieros, por tiempo, por distancias geográficas o por una
combinación de éstos y otros obstáculos, se recurre al muestreo por
racimos o clusters.
En este tipo de muestreo se reducen costos, tiempo y energía, al
considerar que muchas veces las unidades de análisis se encuentran
encapsuladas o encerradas en determinados lugares físicos o
geográficos, a los que se denomina racimos.

Semana 4.
Se obtiene en un proceso de dos etapas en el que la población se divide
inicialmente en conglomerados, y de estos se selecciona un
subconjunto (muestra).
Se denomina así debido a que en la selección de la muestra, en lugar de
escogerse cada unidad se procede a tomar los conjuntos de unidades, a
los que se llama conglomerados.
Se diferencia de los estratos en que, para el estrato, el investigador
conoce la distribución de la variable, no así en el de conglomerado.
Además, el cluster es heterogéneo en su interior y homogéneo entre sí,
es decir, en cada uno de los conglomerados existen individuos con
diversas características pero ellos entre sí son homogéneos.

Semana 4.
¿Cómo se toma la muestra?
El primer paso es la definición de los conglomerados, y se continúa con
la selección de los subconjuntos a estudiar, o sea, se realizan muestreos
de conglomerados.
De estos grupos o conjuntos seleccionados se procede a hacer un
listado de las unidades que componen cada conglomerado.
Posteriormente se realiza la selección de las unidades que integrarán la
muestra, siguiendo algunos de los métodos aleatorios indicados.

Semana 4.
¿Cómo se calcula el tamaño muestral?

Efectuar un muestreo significa seleccionar <<n>> elementos de un


universo objeto de estudio de tamaño <<N>>, siendo <<n>> Є <<N>>,
con el fin de que a partir de estos <<n>> elementos se puedan deducir
determinadas características de dicho universo objeto de estudio,
dentro de un determinado margen de confianza.
Los individuos o elementos del universo que se seleccionen para ser
observados constituirán una muestra. El número de individuos o
elementos seleccionados será el tamaño de la muestra.
Normalmente, cuando se lleva a cabo una investigación, lo que se

Semana 4.
pretende es obtener información sobre: valores medios o
proporciones.
En la determinación del tamaño de la muestra a utilizar en una
investigación intervienen 3 elementos:

1) El error absoluto: también llamado nivel de precisión, es la diferencia


máxima que el investigador está dispuesto a admitir <<a priori>>,
entre los valores que obtenga de la muestra y los reales poblacionales.
2) El intervalo de confianza: depende de la probabilidad con que el
investigador desea que se cumpla que efectivamente la diferencia
entre la estimación y el valor real esté comprendida en los márgenes
señalados por el error absoluto.
3) El error muestral: es la desviación típica del estimador, por lo que será

Semana 4.
distinta según estemos estimando un valor medio o una proporción.
En ambos casos, sin embargo, la desviación típica del estimador
disminuirá a medida que el tamaño de la muestre se incremente.
Semana 4.
Cuando el universo objeto de estudio sea infinito (más de 100.000)

Semana 4.
σ = desviación estándar
e = D = error o nivel de precisión
Z = valor asociado al NC
p = proporción p
q = proporción q
Suponga que el investigador desea calcular con mayor precisión los
gastos mensuales de los hogares de una gran metrópoli en compras en
tiendas departamentales de manera que el estimado esté dentro de
$5.00 del verdadero valor de la población. ¿Cuál debería ser el tamaño
de la muestra?
Deben seguirse los siguientes pasos:
1) Especifique el nivel de precisión. Éste es la diferencia máxima
permitida (e) entre la media de la muestra y la media de la población.
En nuestro ejemplo, e o D es igual a $5.00.
2) Especifique el nivel de confianza. Suponga que se desea un nivel de
confianza del 95%.

Semana 4.
3) Determine el valor z asociado con el nivel de confianza usando la
tabla Normal. Para un nivel de confianza del 95 por ciento, la
probabilidad de que la media de la población caiga fuera de uno de los
extremos del intervalo es 0.025(0.05/2). El valor z asociado es 1.96.
Z = 1,96

95% Nivel de Confianza

0,4750*2=0,95=95%

Semana 4.
4) Determine la desviación estándar de la población, la cual puede
obtenerse de fuentes secundarias o calcularse usando estudio piloto.
Otra alternativa es calcularla a partir del juicio del investigador. Por
ejemplo, el rango de una variable distribuida normalmente es
aproximadamente igual a más o menos tres desviaciones estándar, por
lo que es posible entonces calcular la desviación estándar dividiendo el
rango entre 6.
La desviación estándar para este ejemplo es 55.
5) Determine el tamaño de la muestra usando la fórmula para el error
estándar de la media.

Semana 4.
1,962 ∗ 552
𝑛= = 465
52
Si el estadístico de interés es una proporción, en vez de una media, el
procedimiento para determinar el tamaño de la muestra es similar.
Suponga que el investigador está interesado en calcular la proporción
de hogares que poseen una tarjeta de crédito de una tienda
departamental. ¿Cuál debería ser el tamaño de la muestra?
Deben seguirse los siguientes pasos:
1) Especifique el nivel de precisión. Especifique el nivel de precisión.
Suponga que la precisión deseada es tal que el intervalo permitido se
establece como e = +- 0,05. Éste es la diferencia máxima permitida (e)
entre la proporción de la muestra y la proporción de la población. En
nuestro ejemplo, e es igual al 5%.

Semana 4.
2) Especifique el nivel de confianza. Suponga que se desea un nivel de
confianza del 95%.
3) Determine el valor z asociado con el nivel de confianza usando la
tabla Normal. Para un nivel de confianza del 95 por ciento, la
probabilidad de que la media de la población caiga fuera de uno de los
extremos del intervalo es 0.025(0.05/2). El valor z asociado es 1.96.
4) Calcule la proporción de la población π (p). Como se explicó antes, la
proporción de la población puede calcularse a partir de fuentes
secundarias, usando un estudio piloto, a partir del juicio del
investigador o suponiendo varianza máxima. Suponga que, con base en
datos secundarios, el investigador calcula que el 64 por ciento de los
hogares en la población meta posee una tarjeta de crédito de una
tienda departamental. Por lo tanto, π = p = 0,64.
Si p = 0,64, q entonces será 1-p = 1 – 0,64 = 0,36.
5) Determine el tamaño de la muestra usando la fórmula para el error
estándar de la proporción.

Semana 4.
0,64 ∗ 1 − 0,64 ∗ 1,962
𝑛= = 355
0,052
Si el tamaño de la muestra resultante representa el 10 por ciento o más de la
población, debe aplicarse la corrección de la población finita (cpf).
También se puede aplicar el cpf cuando no se conoce el tamaño de la población.

Semana 4.
σ = desviación estándar
e = error o nivel de precisión
Z = valor asociado al NC
p = proporción p
q = proporción q
N = Tamaño de la población
𝝈 2 𝒁2
n para media en población infinita. 𝒏=
𝑫2

𝒑𝒒𝒁2
n para proporción en población infinita. 𝒏=
𝑫2

𝑵𝝈2 𝒁2
n para media en población finita. 𝒏=
𝑵 − 1 𝑫 2 + 𝝈 2 𝒁2

Semana 4.
𝒑𝒒𝒁2 𝑵
n para proporción en población infinita. 𝒏=
ሺ𝑵 − 1)𝑫2 + 𝒑𝒒𝒁2

You might also like