You are on page 1of 14

INSTITUTO UNIVERSITARIA POLITECNICO GRAN COLOMBIANO

FACULTAD DE CIENCIAS ADMINISTRATIVAS, ECONOMICAS Y CONTABLES


CONTADURIA PUBLICA

ESTADISTICA II

SOLUCION EJERCICIO FORO SEMANA 3 A 5

HEYDI LORENA HOYOS CUBILLOS


VANESSA NATALI MORA ARTURO
DORA MARIA ORTIZ VELASQUEZ
CLAUDIA ESPERANZA VILLAMIL
JOHANA ANDREA ZAPATA
OBJETIVO GENERAL

Aplicar los conocimientos adquiridos durante el semestre cursado actualmente, para así poder a nivel
profesional generar informes confiables y reales que permitan la toma de decisiones al área de
gerencia financiera de la compañía o firma que representemos como profesionales.

OBJETIVOS ESPECÍFICOS

 Aprender a tomas muestras confiables de una población general

 Aprender a medir intervalos de confianza que generen credibilidad y certeza en la


información

 Aplicar hipótesis para variables que puedan surgir en el desarrollo de los ejercicios
Contexto
A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH), realizada
por el DANE [1]. Esta encuesta se hace en las 13 ciudades principales del Colombia (Bogotá,
Medellín, Cali, barranquilla, Bucaramanga, Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio,
Montería, Cartagena) y 11 ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó,
Neiva, Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se solicita
información sobre las condiciones de empleo de las personas (si trabajan, en qué trabajan, cuánto
ganan, si tienen seguridad social en salud o si están buscando empleo), además de las características
generales de la población como sexo, edad, estado civil y nivel educativo, se pregunta sobre sus
fuentes de ingresos. La GEIH proporciona al país información a nivel nacional, cabecera - resto,
regional, departamental, y para cada una de las capitales de los departamentos.

Base de datos: en el archivo de Excel ( https://goo.gl/zB3Ntf ) se tiene información sobre las


características generales de las personas que respondieron en un mes en particular. Para este trabajo
colaborativo, realice lo siguiente:

Selección de muestra

1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos
de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la
población. En ese sentido, escoja un tipo de muestreo y argumente la viabilidad de esta técnica
para la base de datos dada. Para seleccionar una muestra debe tenerse en cuenta el cómo
seleccionar los elementos que formarán parte de la muestra (tipo de muestreo) y cuántos
elementos debemos seleccionar (Tamaño de muestra).

2. Utilizando la variable género P(6020) determine el tamaño de la muestra seleccionando


adecuadamente y justificando:
a. Fórmula para desarrollar
b. Estimación de la proporción de mujeres
c. Nivel de confiabilidad
d. Error de estimación

Solucion:

COMO SELECCIONAR LA MUESTRA: Para el desarrollo de este ejercicio vamos a utilizar el


muestreo aleatorio simple, este procedimiento nos permite dar a cada elemento de la población la
misma probabilidad de ser seleccionado en medio de una toma de muestra. este tipo de muestreo tiene
las siguientes ventajas y desventajas:

Ventajas y desventajas del muestreo aleatorio simple

 Entre sus puntos fuertes están que tiende a producir muestras representativas y permite el
uso de la estadística inferencial en el análisis de datos recogidos.
 Cada selección es independiente de otras selecciones; Todas las combinaciones posibles de
unidades de muestreo tienen la misma oportunidad de ser seleccionadas. En el muestreo
sistemático, las posibilidades de ser seleccionado no son independientes entre sí.

 En general, es más fácil que otros procedimientos de muestreo probabilístico (tales como el
muestreo por conglomerados) de comprender y comunicar a otros.

 Los procedimientos estadísticos requeridos para analizar los datos y calcular los errores son
más fáciles que los requeridos en otros procedimientos de muestreo probabilístico. Te
recomiendo leer: Tipos de errores.

 Entre las desventajas están que se requiere un marco de muestreo de elementos de la


población objetivo.

 Un marco de muestreo apropiado puede que no exista para la población que se dirige, y
puede que no sea factible o práctico construir uno. En este caso el muestreo por
conglomerados no requiere de una toma de muestra de los elementos de la población
objetivo.

 El muestreo aleatorio simple tiende a tener errores de muestreo más grandes y menos
precisión de muestreo estratificado del mismo tamaño de la muestra.
 Los encuestados pueden estar muy dispersos, por tanto, los costos de la recolección de datos
pueden ser superiores a las de otros diseños de la muestra de probabilidad, como el muestreo
por conglomerados.

 El muestreo aleatorio simple puede no producir un número suficiente de elementos de


pequeños subgrupos. Esto no haría de un muestreo aleatorio simple una buena opción para
los estudios que requieren un análisis comparativo de las categorías pequeñas de una
población con categorías mucho más amplias de la población.

1. 1 Para iniciar tomamos el tamaño de la muestra para la encuesta realizada por el DANE, esta
corresponde al número de personas que componen la muestra extraída de la totalidad de la
población a quienes se les realizo la encuesta. En esta ocasión vamos a calcular el tamaño de
muestra finita. Tenemos los siguientes datos:
Datos:
Proporcion desconocida 0.50
n tamaño de muestra buscado
fijar un Error 0.1
Nivel de confiabilidad 95% N tamaño de la poblacion

alpha 0.05 Z parametro estadistico que depende el N


alpha/2 0.025 e Error de estimacion maximo aceptado
Z_(alpha/2) 1.96 p probabilidad de que ocurra el evento
q (1 - p )=probabilidad de que no ocurra.

Fórmula para hallar el tamaño de la muestra


Resultado de la muestra:

Tamaño de la muestra 96

Para hallar el error de estimación de los datos utilizamos la siguiente formula:

e= Z^𝟐 √ P(1-P)/n
al reemplazar la formula el error de estimación fue de:
ERROR DE ESTIMACION
e= 0.01020833

Para obtener la estimación de la proporción de mujeres ordenamos por orden alfabético y contamos
el numero de mujeres y el dato lo dividimos sobre el tamaño de la muestra (96), el mismo
procedimiento lo realizamos con la base de datos de los hombres.

mujeres 50
Hombres 46
N° Sexo N° Sexo
1 Hombre 1 Mujer
2 Hombre 2 Mujer
3 Hombre 3 Mujer
4 Hombre 4 Mujer
5 Hombre 5 Mujer
6 Hombre 6 Mujer
7 Hombre 7 Mujer
8 Hombre 8 Mujer
9 Hombre 9 Mujer
10 Hombre 10 Mujer
11 Hombre 11 Mujer
12 Hombre 12 Mujer
13 Hombre 13 Mujer
14 Hombre 14 Mujer
15 Hombre 15 Mujer
16 Hombre 16 Mujer
17 Hombre 17 Mujer
18 Hombre 18 Mujer
19 Hombre 19 Mujer
20 Hombre 20 Mujer
21 Hombre 21 Mujer
22 Hombre 22 Mujer
23 Hombre 23 Mujer
24 Hombre 24 Mujer
25 Hombre 25 Mujer
26 Hombre 26 Mujer
27 Hombre 27 Mujer
28 Hombre 28 Mujer
29 Hombre 29 Mujer
30 Hombre 30 Mujer
31 Hombre 31 Mujer
32 Hombre 32 Mujer
33 Hombre 33 Mujer
34 Hombre 34 Mujer
35 Hombre 35 Mujer
36 Hombre 36 Mujer
37 Hombre 37 Mujer
38 Hombre 38 Mujer
39 Hombre 39 Mujer
40 Hombre 40 Mujer
41 Hombre 41 Mujer
42 Hombre 42 Mujer
43 Hombre 43 Mujer
44 Hombre 44 Mujer
45 Hombre 45 Mujer
46 Hombre 46 Mujer
47 Mujer
48 Mujer
49 Mujer
50 Mujer
Porcentaje de proporción de la muestra:
De las mujeres se tiene una estimación del 52% en cuanto a los hombres presentan una estimación
del 48%

0.52 52% Mujeres


0.48 48% Hombres

Intervalo de confianza para dos variables numéricas


Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los hombres
y las mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los
hombres y mujeres. Según los resultados, ¿Existen diferencias?
2. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% para
estimar, la escolaridad promedio de los hombres y de las mujeres de forma individual, en los
niveles de estudio de Bachiller, Tecnólogo y Universitario.
3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para estimar
la diferencia promedio de escolaridad para los hombres y mujeres, en los niveles de estudio
de Bachiller, Tecnólogo y Universitario.

Solucion:

Histograma Nivel Educativo Mujeres

Para realizar la grafica sacamos los datos por categorías y sumamos cuantas mujeres pertenecían o se
encontraban en ese intervalo.

escolaridad Cantidad
mujer entre 0 0
mujer entre 1 7
mujer entre 2 6
mujer entre 3 6
mujer entre 4 1
mujer entre 5 8
mujer entre 6 5
mujer entre 7 6
mujer entre 8 3
mujer entre 9 2
mujer entre 10 0
mujer entre 11 8
mujer entre 12 2
mujer entre 13 1
mujer entre 14 2
mujer entre 15 2
mujer entre 16 10
mujer entre 17 0
mujer entre 18 2
mujer entre 19 1
De igual manera realizamos el mismo ejercicio con la información que se tiene de los hombres, el
cual la grafica quedo de la siguiente manera:
Escolaridad Cantidad
Hombre entre 0 21
Hombre entre 1 5
Hombre entre 2 2
Hombre entre 3 1
Hombre entre 4 10
Hombre entre 5 9
Hombre entre 6 3
Hombre entre 7 0
Hombre entre 8 5
Hombre entre 9 3
Hombre entre 10 0
Hombre entre 11 15
Hombre entre 12 1
Hombre entre 13 2
Hombre entre 14 7
Hombre entre 15 1
Hombre entre 16 11

Quedando el histograma de la siguiente manera:


Para poder hallar el nivel educativo de las mujeres se filtro la base de datos, sacamos la informacion
por categorías y totalizamos quedando la informacion de la siguiente manera:
Nivel de Escolaridad Numero
0 4
Básica primaria (1o - 5o) 27
Básica secundaria (6o - 9o) 17
Media (10o - 13o) 7
Preescolar 1
Ninguno 9
Superior o universitaria 21
86

Para poder calcular el nivel académico de las mujeres se tuvieron en cuenta los siguientes datos:
96 muestra
12 promedio
95% confianza
40 desviacion
z 1.96
alfa 5%

Reemplazando la siguiente formula:


X+-z*d/raiz(n)

El cual al reemplazar seria la siguiente manera:


96-1.96*40/RAIZ(12)= 73.37 inicio de nivel de confianza
Usamos la misma formula en vez de restar la muestra con el z lo sumamos
96+1.96*40/RAIZ(12)= 118.63 hasta este rango seria el nivel de confianza.
El cual la gráfica quedaría de la siguiente manera:
Para hallar el nivel académico de los hombres, realizamos el mismo procedimiento realizando la
formula minimizando la base de datos, quedando de la siguiente manera:

Nivel de Escolaridad Numero


0 4
Básica primaria (1o - 5o) 27
Básica secundaria (6o - 9o) 10
Media (10o - 13o) 14
Preescolar 5
Ninguno 10
Superior o universitaria 23
93

Tenemos los siguientes datos:


96 muestra
13 promedio
95% confianza
40 desviacion
z 1.96
alfa 5%

Del cual al tomar la formula anterior quedaría de la siguiente manera:


96-1.96*40/RAIZ(13)= 74.26
96+1.96*40/RAIZ(12)= 117.74
Quedando la gráfica de la siguiente manera:

Nivel de confianza mujeres:


86 muestra 66.99 nivel de confiaza desde
17 promedio 105.01 hasta
95% confianza
40 desviacion
z 1.96
alfa 5%

86 muestra 56.37 nivel de confiaza desde


7 promedio 115.63 hasta
95% confianza
40 desviacion
z 1.96
alfa 5%

86 muestra 68.89 nivel de confiaza desde


21 promedio 103.11 hasta
95% confianza
40 desviacion
z 1.96
alfa 5%

Nivel de Confianza Hombres:


96 muestra 71.21 nivel de confiaza desde
10 promedio 120.79 hasta
95% confianza
40 desviacion
z 1.96
alfa 5%

96 muestra 75.05 nivel de confiaza desde


14 promedio 116.95 hasta
95% confianza
40 desviacion
z 1.96
alfa 5%

96 muestra 79.65 nivel de confiaza desde


23 promedio 112.35 hasta
95% confianza
40 desviacion
z 1.96
alfa 5%

Prueba de hipótesis para dos variables nominales


Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las mujeres en
Colombia. Para determinar lo anterior, use la “muestra” encontrada en la semana 3:
1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo
(P6020), realice un diagrama de barras comparativo para los hombres y mujeres en un solo
gráfico. Según los resultados, ¿Existen diferencias?
2. Con un nivel de confianza del 95%, estime e interprete la proporción de hombres y de mujeres
que asisten a un establecimiento oficial.
3. Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice un
nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?

Solucion: Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo


(P6020) Realice un diagrama de barras comparativo para los hombres y mujeres en
SEXO ASISTE SEXO ASISTE
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Hombre Sí Mujer Sí
Se usaron los siguientes datos:
SEXO SI ASISTEN NO ASISTEN
MUJERES 6803 25166
HOMBRES 6917 21470

mujeres 31969 % si asisten %no asisten


hombres 28387 21% 79%
24% 76%

La grafica quedaría de la siguiente manera:

NOTA: Existe una diferencia del 3% entre mujeres y hombres que si asisten a un establecimiento
oficial
CONCLUSIONES

 Las gráficas representan una herramienta muy importante en la interpretación de cifras, hacen
parte elemental de la presentación de informes pues permiten una fácil visualización de lo
expuesto.
 La estadística es parte elemental en el área contable pues permite a través del análisis de datos
la verificación de variables que dependen muchas veces del mercado, lo que permite que se
tenga un control de cifras y se actúe a tiempo en caso de que algún área este fuera de los
niveles esperados por la empresa.
 El desarrollo de este trabajo nos prepara para un análisis profundo de bases de datos grandes
que tienen suficientes variables como lo son las de bancos, fiduciarias y demás compañías
que manejan un nivel grande de clientes

BIBLIOGRAFIA

VISAUTA, B. (1997) Análisis estadístico con SPSS para Windows: estádistica básica. Madrid: McGraw-
Hill Interamericana de España.

ALEA, V. et al. (1999) Estadística Aplicada a les Ciències Econòmiques i Socials. Barcelona: Edicions
McGraw-Hill EUB.

DURA PEIRó, J. M. y LóPEZ CUñAT, J.M. (1992) Fundamentos de Estadística. Estadística Descriptiva
y Modelos Probabilísticos para la Inferencia. Madrid: Ariel Editorial.

ESCUDER, R. y SANTIAGO, J. (1995) Estadística aplicada. Economía y Ciencias Sociales. Valencia:


Tirant lo Blanch.

You might also like