Professional Documents
Culture Documents
ESTADISTICA
INTRODUCCION.
La estadstica es una materia que ha adquirido una importante presencia en los ltimos
20 aos en diferentes reas como las ciencias sociales, biologas, bioqumicas y ciencias
bsicas. El impacto del estudio de problemas estadsticos es estas y otras reas representan
en una enorme aportacin al conocimiento de la humanidad y al desarrollo tecnolgico.
La administracin y la economa son otras de las disciplinas que no podran sustraerse a
los benficos metodolgicos de la estadstica. As por ejemplo, observar, analizar e
interpretar los precios de un producto dar lugar a que un administrador tome alguna
decisin para no afectar la economa de su empresa. La informacin que obtengan
mediante la coleccin, investigacin y entendimiento de los datos, les permite evaluar si
las tcticas empleadas resultan eficientes.
Como podr verse en el ejemplo anterior, los datos constituyen la materia prima para
la generacin de informacin, la cual a su vez se transformar en conocimiento a partir
de su anlisis e interpretacin. Y es en este proceso donde la estadstica desempea una
trascendente funcin en prcticamente todas las disciplinas.
a. QUE ES LA ESTADISTICA?
Es la rama de las matemticas que se encarga de describir, analizar e interpretar las
caractersticas de un conjunto de individuos o poblacin.
Se recogen datos de diversos tipos para construir informes donde se analicen situaciones
y cuestiones relacionadas con un tema determinado.
Aunque pueden recogerse datos numricos (cuantitativos) o escritos (cualitativos), el
tratamiento que se hace con los datos es numrico.
La estadstica en general, es la ciencia que trata de la recopilacin, organizacin,
presentacin, anlisis e interpretacin de datos numricos con el fin de realizar una toma
de decisiones ms efectivas.
1.2 DEFINICION DE ESTADISTICA.
Conjunto de teoras y mtodos que han sido desarrollados para tratar la recopilacin,
organizacin y anlisis de datos o hechos numricos, con el fin de sacar conclusiones.
(Esperanza More)
Es una ciencia de recolectar, organizar, presentar e interpretar datos numricos que tiene
como finalidad facilitar la solucin de problemas en los cuales necesitamos conocer
algunas caractersticas sobre el comportamiento de algn suceso o evento, caracterstica
que nos permite conocer o mejorar el conocimiento de ese suceso o hecho.
Ejemplo.
Saber qu porcentaje de personas tienen vehculos en una determinada ciudad.
trabajada u obtenida en una parte de la poblacin. Se reconoce, sin embargo, que hay una
cierta probabilidad de que la generalizacin (Inferencia) este equivocada, lo cual indica
el importante papel desempeado por la inferencia estadstica en las organizaciones
modernas.
La estadstica inferencial es aquella que tambin llamamos inductiva, porque parte de
casos particulares a casos generales; para referirnos a los datos o unidades de muestreo
en ese tipo de estadstica se utiliza el termino muestra, con lo cual se nos da a entender
que primero se desarrolla la estadstica descriptiva y despus la estadstica inferencial.
La estadstica inferencial comprende las tcnicas de anlisis e interpretacin con las que,
con base nicamente en una muestra sometida a observacin, se toman decisiones sobre
una poblacin o un proceso estadstico. Puesto que tales decisiones se toman en
condiciones de incertidumbre, suponen el uso de conceptos de probabilidad.
Ejemplo.
Si se eligen 1000 personas entre los 5 millones setecientos mil que laboran en la
Repblica del Ecuador en el 2017 y se obtiene sus ganancias anuales, los 1000 valores
constituyen una muestra a l cual se le calculara el promedio de ganancias anuales, cuyo
resultado es un estadstico.
1.4 IMPORTANCIA DE LA ESTADISTICA
La estadstica es la base del conocimiento prctico y real. La estadstica, si bien es una
ciencia de extraccin exacta, tiene una injerencia directa en cuestiones sociales por lo cual
su utilidad prctica es mucho ms comprensible que lo que sucede normalmente con otras
ciencias exactas como la matemtica.
A diferencia de otras ramas de la matemtica que poseen una parte importante de
abstraccin, la estadstica tiene aplicaciones directas y concretas en la vida real ya que
toma los nmeros y cifras de diferentes fenmenos sociales como por ejemplo la
desocupacin, la tasa de mortalidad, la de natalidad y muchos otros datos incluso ms
complejos.
Podemos decir que la funcin principal de la estadstica es justamente la recoleccin y
agrupamiento de datos de diverso tipo para construir con ellos informes estadsticos que
nos den idea sobre diferentes y muy variados temas, siempre desde un punto de vista
cuantitativo y no cualitativo. Esto es muy importante de remarcar ya que la estadstica se
convierte entonces en una ciencia que nos habla de cantidades (por ejemplo, cuantas
personas viven en un pas por metro cuadrado pero no nos da informacin directa sobre
la calidad de vida. En este sentido podemos decir que se presentan varias limitaciones ya
que no permite conocer ms que numricamente aspectos que requieren un trabajo ms
complejo y profundo.
Ejemplo:
a. El importe de la beca que recibe un estudiante.
b. Los ingresos que genera un peridico en lnea.
c. El nmero de revistas publicadas por un editorial.
d. Los ingresos de todos los asalariados.
e. Los puntajes que reciben los estudiantes en un examen final de estadstica.
En cada caso, las observaciones se miden numricamente.
Variable cualitativa.
Variable que categoriza o describe cualitativamente un elemento de la poblacin. Suele
ser del tipo alfanumrico, pero incluso en el caso en que sea numrico no tiene sentido
usarla en operaciones aritmticas.
Ejemplo.
preciso, puede hallarse una tercera observacin que se encuentre entre las dos primeras.
Una variable continua generalmente resulta de la medicin.
Ejemplo:
a. Altura o peso de un estudiante.
b. Tiempo que transcurre entre la publicacin de una encuesta en lnea y el instante
en que ya la han completado un centenar de internautas.
c. Factor de impacto (sin redondear) de una revista.
NIVELES DE MEDICION
Los datos se clasifican por niveles de medicin. El nivel de medicin de los datos rige los
clculos que se llevan a cabo con el fin de resumir y presentar los datos. Tambin
determinan las pruebas estadsticas que se deben realizar.
De hecho, existen cuatro niveles de medicin: nominal, ordinal, de intervalo y de razn.
Existe una relacin de orden entre los tipos de variable: cada tipo posee al menos las
propiedades de los tipos que anteceden en dicha relacin.
NOMINALES < ORDINALES < INTERVALO < RAZN
Datos de nivel nominal.
En el caso del nivel nominal de medicin, las observaciones acerca de una variable
cualitativa solo se clasifican y se cuentan. No existe una forma particular para ordenar las
etiquetas.
Son variables cualitativas
Tienen un nmero finito de modalidades
o Permiten establecer relaciones de igualdad o desigualdad entre los
individuos, pero
o No permiten ordenar.
Ejemplo:
Color de ojos
Raza
El genero
Datos de nivel ordinal.
Son variables cualitativas
Tienen un nmero finito de modalidades
o Permiten establecer relaciones de orden entre los individuos, pero
o No permiten determinar distancias entre ellos
Ejemplo:
Ejemplo:
Ingresos, gastos, ventas
Salarios, unidades de produccin, pesos, cambios en los precios de las acciones
La distancia entre sucursales
En resumen, las propiedades de los datos de nivel de razn son las siguientes:
1. Las clasificaciones de los datos se ordena de acuerdo con la cantidad de
caractersticas que poseen.
2. Diferencias iguales en la caracterstica representan diferencias iguales en los
nmeros asignados a las calificaciones.
3. El punto cero representa la ausencia de caractersticas y la razn entre dos
nmeros es significativa.
UNIDAD II
ELEMENTOS FUNDAMENTALES DEL ANALISIS ESTADISTICO
Poblacin.
La poblacin o universo es un conjunto de elementos a los cuales se le estudia algunas
caractersticas comunes; por ejemplo, los docentes de una institucin educativa, las
empresas de un sector productivo, los barrios de una ciudad, los artculos vendidos en un
supermercado, las calificaciones de una prueba de aptitud, entre otros.
La poblacin puede ser finita o infinita. Se estima que una poblacin es finita cuando el
nmero de los elementos que la integran es conocido por el investigador; tal es el caso de
los barrios de una ciudad, los operarios de una industria, etc., mientras que para la
poblacin infinita no se conoce el nmero de elementos, ya sea porque es muy grande o
porque se sabe que existe pero no se conoce el tamao, por ejemplo: los lanzamientos de
un dado, el nmero de veces que una persona puede pasar por un sitio y dems.
Muestra.
La muestra se define como un conjunto de elementos seleccionados adecuadamente, que
pertenecen a una poblacin determinada, o sea que es una parte de la poblacin o
universo. Al seleccionar una muestra se pretende que el anlisis realizado en ella pueda
proporcionar conclusiones similares a las que se lograra si se hubiese estudiado la
totalidad de elementos de la poblacin; por tal razn, la muestra debe ser representativa.
En el caso en los cuales el nmero de elementos de la muestra es igual al de la poblacin,
el estudio se denomina censo.
Ejemplo de poblacin o muestra:
Elaborar productos ms eficientes en la bsqueda de nuevos remedios para el tratamiento
de la caspa, la calvicie, la obesidad, etc. En el tratamiento de la caspa muchas personas
estn involucradas (como en el mundo de la informacin 3), esto es, los bioqumicos que
hacen frmulas para diferente champs u otros productos, los dueos de los laboratorios
que los producen, y las personas que requieren el tratamiento. Ahora bien, aqu la
poblacin queda integrada por las personas que tienen caspa. Si bien en este caso puede
resultar complicado identificar a dichas personas, ser necesario limitar el estudio a un
universo ms especfico. En consecuencia, la muestra ser una parte de las personas con
caspa.
Parmetros.
Los parmetros son medidas cuantitativas que describen una caracterstica de la
poblacin, entre ellas estn: media aritmtica, varianza y coeficiente de variacin. En una
poblacin se presentan muchas caractersticas y, en consecuencia tendr varios
parmetros. Por ejemplo, si la variable es el tiempo de reaccin de sujetos entrenados ante
un estmulo, un parmetro es el tiempo promedio de reaccin de todos los individuos
de la poblacin de inters si estos fueran entrenados.
Estadstico.
Son medidas cuantitativas que describen una caracterstica de la muestra y se consideran
estimadores para la poblacin. Como tal, es una variable porque sus valores dependen de
la muestra que salga seleccionada. Por ejemplo, tiempo promedio de reaccin de 10
individuos que fueron entrenados. Porcentaje de consumidores entre 100 encuestados que
manifestaron tener una actitud positiva frente al producto.
Variables.
Se considera como variable cualquier caracterstica o propiedad general de una poblacin
que sea posible medir con distintos valores o describir con diferentes modalidades, por
ejemplo: el coeficiente intelectual de los estudiantes de un grupo pueden tener diferentes
valores, o el estado civil de los empleados de una organizacin puede estar caracterizado
como soltero, casado, separado, entre otros.
Experimento.
Una actividad planificada, cuyos resultados producen un conjunto de datos que nunca son
constantes.
Datos numricos.
Comprende el conjunto de valores asignados a la variable para cada elemento
perteneciente a la muestra o a la poblacin, los cuales sern analizados e interpretados.
Toma de datos.
Es la obtencin de una coleccin de datos que no han sido ordenados numricamente.
Ordenacin.
Es una coleccin de los datos numricos tomados o recopilados, en orden creciente o
decreciente de magnitud.
Rango.
Es la diferencia entre el valor mayor y el valor menor de los datos numricos.
Datos numricos:
a. No agrupados. Menos de 30 con rango menor o igual a cinco unidades.
b. Agrupados. Ms de 30 con rango estrictamente mayor a cinco unidades.
Funcin.
En el sentido matemtico de que hay una correspondencia entre los datos y el nmero de
veces que ocurre estos.
Frecuencias.
Nmero de veces que ocurre un dato. El primer paso para la descripcin es la recoleccin
de los datos estadsticos necesarios, lo cual se hace por medio de una entrevista personal,
el cuestionario postal, la investigacin de archivos o por algn otro medio. Recolectados
los datos es necesario organizarlos, lo cual sera formando grupos. Los datos que se vayan
a agrupar deben ser ms de 30, si no se agrupan son difciles de trabajar e interpretar.
Tipos de distribucin de frecuencias.
Es la distribucin de frecuencias simple (datos no agrupados) y la distribucin de
frecuencias por intervalos o clases (datos agrupados).
UNIDAD III
DESCRIPCION DE DATOS
Tablas de frecuencias, distribucin de frecuencias y su representacin grfica.
La estadstica se considera un mtodo utilizado para recoger, organizar, concentrar,
reducir, presentar, analizar, generalizar y contrastar los resultados numricos (datos) de
observaciones directas o indirectas de fenmenos reales, as como de la informacin
obtenida a partir de la experimentacin, para estar en condiciones de llevar a cabo tanto
evaluaciones como conclusiones adecuadas, y tomar decisiones acertadas y confiables.
1
ING. NELSON PERALTA MBA
0
UNIVERSIDAD POLITCNICA SALESIANA
CARRERA DE CONTABILIDAD Y AUDITORIA
1
ING. NELSON PERALTA MBA
1
UNIVERSIDAD POLITCNICA SALESIANA
CARRERA DE CONTABILIDAD Y AUDITORIA
26 27 27 28 27 25 26 28
27 28 26 28 25 27 25 26
Grafica de barras.
En ellas, las clases se representan en el eje horizontal y la frecuencia de clase en el eje
vertical. Las frecuencias de clase son proporcionales a las alturas de las barras.
Grafica de pastel.
Grfica que muestra la parte o porcentaje que representa cada clase del total de nmeros
de frecuencia.
1
ING. NELSON PERALTA MBA
2
UNIVERSIDAD POLITCNICA SALESIANA
CARRERA DE CONTABILIDAD Y AUDITORIA
Ejemplo:
SkiLodges.com realiza una prueba de mercado de su nuevo sitio web y le interesa saber
con qu facilidad se navega en su diseo de pgina web. Selecciona al azar 200 usuarios
frecuentes de internet y les pide que lleven a cabo una bsqueda en la pgina web. A cada
uno de ellos le solicita que califique la relativa facilidad para navegar como mala, buena,
excelente o sobresaliente. Los resultados aparecen en la siguiente tabla:
Sobresaliente 102
Excelente 58
Buena 30
Mala 10
Ecuatorian Food, sirve una bebida de cola con un sabor adicional, Cola Plus, muy
popular entre sus clientes. La compaa se encuentra interesada en la frecuencia de los
consumidores por Cola Plus en comparacin con Coca Cola, Pepsi y una bebida de
lima limn. Se pidi a 100 consumidores seleccionados de forma aleatoria que
degustaran una prueba y eligieran la bebida que ms les gustaba. Los resultados aparecen
en la siguiente tabla:
Bebida Nmero
Cola Plus 40
Coca - Cola 25
Pepsi 20
Lima - Limn 15
Total 100
2. Encontramos el dato mayor y el dato menor. Con estos datos encontramos el rango
o recorrido, en formula es:
Rango = R =
anotando en clase, hasta llegar a la ltima clase en la que debe escribir incluido el
dato mayor.
Ejemplo:
Las comisiones ganadas por ocho miembros del equipo de ventas en una cierta empresa,
durante el primer trimestre del ao pasado en dlares, fueron:
1550, 1650, 1475, 1760, 1540, 1495, 1590, 1625, 1485, 1510, 1810, 1990, 1875, 1642,
1655, 1480, 1765, 1545, 1500, 1595, 1630, 1490, 1515, 1815, 1910, 1810, 1880, 1560,
1468 y 1540.
Organice los ingresos mensuales en una distribucin de frecuencias aplicando los pasos.
Distribucin de frecuencias para datos agrupados.
Intervalo de clase. Intervalos adecuados para agrupar los datos.
Frecuencia de clase. El nmero de datos pertenecientes a cada clase.
Lmites de los intervalos de clase. Datos extremos que forman la clase llamada lmites
inferior y superior, es decir el izquierdo y el derecho, respectivamente.
Anchura o amplitud de clase. Es la diferencia entre los lmites de la clase que forman.
Limites reales de los intervalos de clase. Datos que estn a media unidad abajo (arriba)
del lmite inferior (superior).
Tamao de un intervalo de clase. Es la diferencia ntrelos limites reales de clase que
lo forman.
Marca de clase. Es el punto medio de la clase y representante de los datos en esta.
Ejemplo:
En 50 bancos comerciales y/o instituciones de prstamo, se registr el nmero de
solicitudes de prstamos para casas otorgados durante un mes en particular. Los datos son
los siguientes:
2 4 2 32 9 9 2 6 3 1
14 9 16 7 8 19 6 4 4 2
4 18 0 6 13 7 2 8 0 1
14 1 2 2 18 8 24 1 8 5
1 3 11 18 26 3 12 23 5 4
Se solicita presentar la informacin a travs de una tabla de frecuencias.
1
ING. NELSON PERALTA MBA
5
UNIVERSIDAD POLITCNICA SALESIANA
CARRERA DE CONTABILIDAD Y AUDITORIA
1
ING. NELSON PERALTA MBA
6
UNIVERSIDAD POLITCNICA SALESIANA
CARRERA DE CONTABILIDAD Y AUDITORIA
Suma =
Una muestra con n (minscula) observaciones, tiene un a media se representa
con una x testada (que se denomina estadstico).
Una poblacin con N (mayscula) elementos tiene una media (que se
denomina parmetro)
Para datos no agrupados
Adems, se habr de considerar, dentro de este caso nico (el de datos no agrupados), que
la informacin o los datos estadsticos pueden ser repetitivos o no, as como que si hay
datos donde su valorizacin se repite la frecuencia tomar el valor de esa repeticin; en
caso contrario, si no se repite la frecuencia, tomara el valor de uno y el modelo queda
reducido.
Media aritmtica para datos no agrupados muestrales
x=
Media aritmtica para datos agrupados poblacionales
=
1
ING. NELSON PERALTA MBA
7
UNIVERSIDAD POLITCNICA SALESIANA
CARRERA DE CONTABILIDAD Y AUDITORIA
Ejemplo:
Se tienen los siguientes valores de facturacin en miles de dlares: 10, 3, 9, 7, 2.
Cul es el monto de ventas promedio?
2+3+ 7+9+10
x= = = 6,2
5
Los siguientes datos representan las cantidades semanales (en dlares) gastados
en comestibles en un cierto nmero de hogares:
=
(Hacer tabla)
1
ING. NELSON PERALTA MBA
8
UNIVERSIDAD POLITCNICA SALESIANA
CARRERA DE CONTABILIDAD Y AUDITORIA
800,00 9.200,00 7.100,00 5.300,00 3.300,00 3.400,00 5.800,00 7.300,00 1.200,00 3.700,00
6.100,00 7.400,00 2.600,00 4.000,00 6.200,00 7.600,00 2.800,00 4.500,00 6.500,00 7.800,00
(DESARROLLO)
Propiedades de la Media:
1. Todo conjunto de datos de intervalo o de nivel de razn posee una media.
2. Todos los valores se encuentran incluidos en el clculo de la media.
3. La media es nica.
4. La suma de las desviaciones de cada valor de la media es cero.
Ventajas e inconvenientes:
La media aritmtica viene expresada en las mismas unidades que la variable.
En su clculo intervienen todos los valores de la distribucin.
Es el centro de gravedad de toda distribucin, representando a todos los valores
observados.
Es nica.
Su principal inconveniente es que se ve afectada por los valores extremadamente
grandes o pequeos de la distribucin.
LA MEDIANA
La media es una coleccin de datos debidamente ordenados en forma ascendente o
descendente (creciente o decreciente). Es el valor medio o la posicin central, se tenga o
no datos en esta. En este caso la mitad (50%) de los datos estar por encima de la mediana
y la otra mitad (50%) estar por debajo de ella. Se lo representa por Mdn., Med., Me.
La mediana para datos no agrupados.
La mediana de un conjunto de datos es el dato en la posicin media cuando todos los
datos del conjunto se han dispuestos en orden ascendente o descendente. Aqu se
presentan dos situaciones: cuando el nmero de elementos es impar o es par.
1. Primero se ordenan los datos.
2. Luego se calcula la posicin de la mediana con la formula (n + 1) / 2, donde, n es
el nmero de datos.
1er Caso.- Cuando el nmero de datos es impar.- En este caso la mediana se encuentra
en la mitad de la serie ordenada de los datos, se puede encontrar utilizando la siguiente
formula.
+
Mdn =
1
ING. NELSON PERALTA MBA
9
UNIVERSIDAD POLITCNICA SALESIANA
CARRERA DE CONTABILIDAD Y AUDITORIA
Ejemplo:
Se tiene una muestra de tamao 5 con los siguientes valores: 46, 54, 42, 48 y 32
Primer paso, ordenar los datos: 32 42 46 48 54
+ 5+1
Mdn = = =3
2
La mediana es el valor del dato que se encuentra ubicado en la posicin 3, la media es:
Me = 46
2do Caso.- Cuando el nmero de datos es par.- En este caso se utiliza el mismo
procedimiento que el 1er Caso, y se obtiene un nmero entero con decimales, en este caso
la mediana se encuentra hallando la media aritmtica de los dos valores medios.
Ejemplo:
Se ha obtenido una muestra con los valores de datos: 27, 25, 27, 30, 20 y 26 Cmo
se determina la mediana en este caso?
Primer paso, ordenar los datos de forma ascendente: 20 25 26 27 27 30
+ 6+1
Mdn = = = 3,5
2
La mediana es el promedio de los datos que se encuentran en la posicin 3,5. Por lo tanto
la mediana es:
+
Me = = 26,5
Mediana para datos agrupados
Procedimiento
1. De la tabla hallamos las frecuencias acumuladas, lmites de clases
2. Dividimos el nmero total de datos para dos utilizando la expresin
2
3. El resultado encontrado en el paso 2, localizamos en la columna de frecuencias
acumuladas.
4. Aplicamos la frmula de la medida para datos agrupados que est dado por:
( ( ))
Mdn = +
Donde:
2
ING. NELSON PERALTA MBA
0
UNIVERSIDAD POLITCNICA SALESIANA
CARRERA DE CONTABILIDAD Y AUDITORIA
Para identificar la clase mediana se divide n/2 y la primera clase que contenga una
frecuencia acumulada mayor que n/2.
Ejemplo:
Dado la siguiente tabla de frecuencias halle la mediana:
EDAD fi Fa
50 -60 10
60 - 70 18
70 - 80 14
80 - 90 6
90 - 100 2
Total 50
n = 50, entonces n/2 = 50/2 = 25. Buscar la primera frecuencia acumulada mayor que 25,
esa ser la clase media.
Ahora se aplica la formula.
Ventajas e inconvenientes:
Es la medida ms representativa en el caso de variables que solo admiten la escala
ordinal.
Es fcil de calcular.
En la mediana solo influyen los valores centrales y es insensible a los valores
extremos.
En su determinacin no intervienen todos los valores de la variable.
LA MODA (Mo)
Es la medida de tendencia central que considera a la informacin desde el enfoque de
repeticin. La moda es el dato que ms se repite o el dato que ocurre con mayor
2
ING. NELSON PERALTA MBA
1
UNIVERSIDAD POLITCNICA SALESIANA
CARRERA DE CONTABILIDAD Y AUDITORIA
frecuencia. Un grupo de datos puede no tener moda, tener una moda (unimodal), dos
modas (bimodal) o ms de dos modales (multimodal).
La moda para datos no agrupados:
Ejemplo:
a) Encontrar la moda de los valores 1, 4, 10, 8 y 10, que representan la cantidad de
discos vendidos por da durante cierta semana del grupo de pop x.
La moda de los cinco valores es: 10 discos
b) Encontrar la moda de los valores 1, 3, 3, 7, 7 y 8
Hay dos modas, 3 y 7, por lo tanto, se dice que es bimodal.
c) Encontrar la moda de los valores 1, 2, 4 y 9
No hay moda.
La moda para datos agrupados
Para hallar la moda para datos agrupados, primeramente se observa en la columna de las
frecuencias, el valor ms alto (clase con mayor frecuencia). Luego se halla la moda
utilizando la siguiente formula:
1
Mo = Li + ( )+C
1 + 2
Donde:
Li = Lmite inferior de la clase modal (clase con mayor frecuencia)
2
ING. NELSON PERALTA MBA
2