You are on page 1of 8

1 Anlisis Estadstico - ESAN - 2016

CONCEPTOS FUNDAMENTALES

ESTADSTICA
La Estadstica es una ciencia que nos proporciona un conjunto de mtodos y procedimientos que permiten
recopilar, clasificar, presentar, analizar e interpretar datos en forma adecuada para tomar decisiones
cuando prevalecen condiciones de incertidumbre.

Tambin nos permite predecir o afirmar algo acerca de una determinada poblacin a partir de datos
extrados de la misma.

Estos datos son transformados en informacin, lo que permite una toma ms eficiente de decisiones.

Las aplicaciones de la Estadstica se dan en todos los campos del quehacer profesional, en todas las
actividades. Como ejemplos de aplicacin son:
Economa: Nmeros ndice, PBI, turismo, medicin de impactos.
Marketing: segmentacin de mercados, estudio de mercados, posicionamiento de productos
Finanzas: anlisis de riesgos, seguros.
Procesos productivos: control de calidad, medicin de tiempos en los procesos.

Estadstica
Estadstica Descriptiva Estadstica Inferencial

Conjunto de mtodos que


incluyen la recoleccin, Conjunto de mtodos usados
presentacin y caracterizacin de para realizar inferencias, es decir,
un conjunto de datos con el fin para realizar generalizaciones a
de describir apropiadamente las partir de un grupo particular de
diversas caractersticas de ese datos observados, de tal manera
conjunto de datos. Un estudio que se pueda llegar a
estadstico es descriptivo cuando conclusiones vlidas para la
solamente se pretende describir, totalidad de datos.
resumir y analizar los datos.

Generalizaciones
Descripcin
Grupo particular vlidas y
numrica y
de datos conclusiones
grfica de datos
adecuadas
2 Anlisis Estadstico - ESAN - 2016

Ejemplo 1
Se quiere analizar el rendimiento de los alumnos de la Universidad ESAN, para los cual se selecciona un
conjunto de alumnos, se recogen los datos y se observan las caractersticas que nos interesan, se organizan
en tablas, se elaboran grficos y se obtiene la informacin de ellos.

Ejemplo 2
Las encuestas para conocer las preferencias por los candidatos para las prximas elecciones presidenciales.
Basndose en los resultados de una muestra aleatoria, se anuncia que un determinado porcentaje de la
poblacin votara por un candidato en particular.

DEFINICIN BSICAS
Poblacin
Es un conjunto mayor de unidades que pueden ser personas, objetos o cosas, cuyo estudio nos interesa
obtener informacin.

Algunos ejemplos de poblacin serian:


Todas las personas residentes en la Provincia de Arequipa.
Los colegios estatales de nivel Primaria, ubicados en el cono norte de la ciudad de Lima.
Los artculos fabricados por cierta lnea de produccin de una determinada empresa.

Muestra
Subconjunto finito de unidades seleccionadas de la poblacin en estudio. La muestra debe ser
representativa, es decir debe tener, en lo posible las caractersticas similares a las de su poblacin.

Algunos ejemplos de muestra serian:


50 personas seleccionadas, de entre las personas que residen en la Ciudad de Arequipa.
Se seleccionan 35 colegios de nivel Primaria, de entre los colegios ubicados en el cono norte de Lima.
80 artculos elegidos de la produccin de un mes.

Unidad de Anlisis (Unidad Elemental o Unidad Estadstica)


Es el elemento indivisible de la poblacin el cual ser analizado y del cual se obtendrn los datos.

Algunos ejemplos de unidad de anlisis serian:


Una persona residente en la Provincia de Arequipa.
Un colegio estatal de nivel Primaria, ubicado en el cono norte de Lima.
Un artculo fabricado por dicha empresa

Dato (observacin)
Es el resultado obtenido al realizar la medicin o la observacin de la(s) variable(s) de inters, en cada una
de las unidades elementales.

RECOLECCIN DE DATOS
Censo
Cuando se realiza un estudio de toda la poblacin o una enumeracin completa de sta.

Muestreo
Cuando se realiza la seleccin y el estudio de una muestra a partir de una poblacin. La encuesta suele ser
la tcnica ms conocida de muestreo, sin embargo, existen otras tcnicas. Una primera forma de clasificar
el muestreo es:
3 Anlisis Estadstico - ESAN - 2016

Muestreo aleatorio
Son aquellas en las que sus elementos han sido elegidos de modo fortuito, es decir al azar, con un
criterio probabilstico.

Muestreo no aleatorio
Son aquellas cuyos elementos resultan de un muestreo dirigido (interviene un experto en la
designacin de los elementos de la muestra).

VARIABLES ESTADSTICAS
Es una caracterstica de los datos que interesa al investigador y que puede tomar diferentes valores.
Generalmente se les representa mediante una letra mayscula (X, Y, Z, etc.)

Ejemplo
En un grupo de estudiantes que asisten a la universidad nos interesan las siguientes caractersticas: Talla,
peso, edad, el tipo de movilidad que utiliza para trasladarse a la Universidad y el nmero de curso en el cual
se ha matricula el presente periodo acadmico.

Talla Peso Edad Tipo de Nmero


Variables
Movilidad de cursos
1.68 54 18 AUTO PROPIO 5

Datos 1.70 55 20 MICRO 5


1.75 58 21 AMIGOS 6
1.62 60 19 MICRO 4

Clasificacin de las variables

Variable

Variable Variable
cualitativa cuantitativa

Nominal Ordinal Discreta Continua

Variables cualitativas
Son variables cuyos valores consisten en categoras de clasificacin, es decir se refieren a la cualidad que
presenta o la categora a la que pertenece. Estas variables se clasifican en Nominales y Ordinales.

Variable Cualitativa Nominal:


Es aquella que surge cuando se definen categoras que no son susceptibles de un ordenamiento. (Color
de los ojos, gnero, profesin, marca de gaseosa que prefiere)
Variable Cualitativa Ordinal:
Es aquella que surge cuando se definen categoras que pueden ser ordenadas de acuerdo a una
jerarqua o prioridad. (Nivel de instruccin alcanzado, jerarqua en las instituciones armadas o
policiales, Nivel Socioeconmico)
4 Anlisis Estadstico - ESAN - 2016

Variables cuantitativas
Son aquellas variables que toman valores numricos y se obtienen como el resultado de un proceso de
conteo o un proceso de medicin. Se clasifican en Discretas y Continuas.

Variable Cuantitativa Discreta:


Es aquella que slo pueden asumir valores enteros. Estas variables estn asociada a un proceso de
conteo. (Nmero de hijos por familia, nmero de cursos matriculados)
Variable Cuantitativa Continua:
Es aquella variable cuyas magnitudes pueden asumir cualquier valor dentro de un recorrido o intervalo
dado. Estas variables estn asociadas a procesos de medicin (tiempo, peso, ingreso, utilidad).

ESCALAS DE MEDICIN
La escala de medicin determina la cantidad de informacin contenida en el dato y nos indica la manera
ms apropiada de resumir y analizar estadsticamente los datos.

Escalas de medicin
Nominal Ordinal Intervalo Razn

Si los datos de son una


etiqueta o un nombre Cuando los datos Cuando los datos tengan Cuando los datos tengan
que identifican un muestran las las caractersticas de la las caractersticas de una
atributo de un elemento caractersticas de un escala Ordinal y adems escala de Intervalos y
y que se usan escala Nominal y el intervalo entre valores adems en esta escala el
simplemente para adicionalmente tiene se expresa en trminos punto cero fijo. En esta
clasificar un objeto, sentido el orden o la de una unidad de escala la razn de
persona o caracterstica. jerarqua en los atributos medicin fija. Siempre cualquiera de dos puntos
Esta escala tambin es o en lo datos. Esta escala son numricos y el punto es independiente de la
conocida como escala tambin es conocida cero la unidad de unidad de medida.
categrica o como Escala de Rangos. medicin son arbitrarios.
clasificatoria.

Ejemplos Ejemplos
Ejemplos
Nmero del Seguro Social de Clasificacin de la calidad de Ejemplos
una persona. un producto. Peso de un artculo.
Calificacin en una prueba de
Nmero de un jugador de Posicin de equipo en un aptitud . Precio de un automvil.
ftbol. torneo. Temperatura en grados Tiempo de vida til de un
Tipos de Tiendas (segn su Orden de preferencia de un Celcius o Farenheit. artefacto elctrico.
giro). producto.
5 Anlisis Estadstico - ESAN - 2016

PARMETRO Y ESTADGRAFO
Parmetro
Es un nmero o una medida de resumen que describe alguna caracterstica de toda la poblacin y para
determinar su valor numrico es necesario utilizar la informacin de toda la poblacin, y por lo tanto las
decisiones se toman con certidumbre total.

Los principales parmetros son:


Media Poblacional (Notacin: )
Varianza Poblacional (Notacin: 2 )
Proporcin Poblacional (Notacin: )

Estadgrafo
Es un nmero o medida de resumen, que describe alguna caracterstica de la muestra y para determinar su
valor numrico se utiliza slo la informacin de la muestra, y la toma de decisiones contiene un grado de
incertidumbre.

Los principales estadgrafos son:


Media muestral (notacin: )
Varianza muestral (notacin: S2 )
Proporcin muestral (notacin: p )

DATOS DE SECCIN TRANSVERSAL Y DE SERIES DE TIEMPO


Datos de corte transversal:
Son datos recolectados en el mismo momento del tiempo o aproximadamente en el mismo momento
del tiempo.

Datos de series de tiempo:


Son datos recolectados a lo largo de varios perodos de tiempo, que pueden ser meses, trimestres, aos,
quinquenios, etc.
6 Anlisis Estadstico - ESAN - 2016

Ejercicios propuestos

1. Lea los enunciados y marque la opcin que considere ms apropiada.

A. Los mtodos usados para obtener conclusiones acerca de caractersticas de inters de una
poblacin en estudio, sobre la base de informacin proveniente de una muestra aleatoria
seleccionada de dicha poblacin, se denomina:
a. estadstica inferencial d. estadstica comparada
b. media poblacional e. media comparada.
c. estadstica descriptiva

B. El resultado obtenido al realizar la medicin de la(s) variable(s) de inters, en cada una de las
unidades elementales se denomina:
a. poblacin d. dato u observacin
b. estadgrafo e. variable estadstica.
c. muestra

C. En esta escala los datos de la variable son una etiqueta o un nombre que identifican un atributo y
adems la jerarqua de los atributos tiene sentido:
a. escala nominal d. escala de intervalo
b. escala ordinal e. escala aleatoria
c. escala de razn

2. Indique la verdad o falsedad de las siguientes afirmaciones. De ser falsa la expresin, modifquela para
que sea verdadera.
a. En cierta fbrica que produce engranajes para automviles, se toman 5 unidades cada dos hora para
analizarlos y analizar la calidad de la produccin. A base de los resultados del anlisis de la calidad de
los engranajes seleccionados se toma una decisin sobre la continuacin o no de la produccin.
Luego, la fbrica utiliza solamente estadstica descriptiva para el control de calidad de su produccin.
b. Con el fin de aplicar medidas de reactivacin del sector industrial en el rubro de calzado en Lima, se
est haciendo un censo de todas las fbricas de calzado de la ciudad. Al evaluar estos resultados
tenderemos informacin que ser til para realizar inferencias estadsticas.
c. El tipo de variable que permite conocer si una caracterstica pertenece al grupo A, B o C se denomina
cualitativa discreta.
d. Una variable cuantitativa continua se puede expresar como una variable cualitativa ordinal (si su
respuesta es VERDADERO, d un ejemplo).
e. El color de las pinturas producidas por TEKNO es una variable cualitativa en escala nominal.
f. Al profesor de la clase de Matemticas I le pidieron elegir a 5 alumnos para representar al saln en
cierta presentacin. El profesor eligi a los alumnos con las notas ms altas. Por lo tanto, esa
seleccin representa una muestra probabilstica.
g. Luego del Censo Nacional realizado por el INEI se pudo conocer que en el departamento de Junn, el
85% del rea cultivable est adecuadamente abonada. El porcentaje mencionado representa una
inferencia estadstica.
h. Cuando una empresa de sondeos de opinin y estudios de mercado determina el porcentaje de
aceptacin de un candidato, lo que est haciendo es determinar con exactitud el valor del parmetro
de inters.
i. En una encuesta realizada por Apoyo S.A. en Lima Metropolitana se determin que 80 de cada 400
personas consideraban posible la clasificacin al prximo Mundial de ftbol. Entonces, este
porcentaje representa una inferencia estadstica.

3. En un determinado estudio se trata de investigar la situacin laboral de las personas que egresaron de la
universidad en la dcada 2001-2010, de las especialidades de ingeniera, de las universidades del pas.
7 Anlisis Estadstico - ESAN - 2016

Con este fin se selecciona a 250 profesionales con las caracterstica mencionadas y se les solicit datos
sobre:
Situacin laboral (empleado, desempleado, subempleado).
Departamento de residencia.
Ingreso mensual (en soles).
Cantidad de personas a su cargo.
Estado civil.
De acuerdo a la situacin:
a. Identifique la poblacin, la muestra, la unidad estadstica, las variables, tipos de variable y escala.
b. Elija dos variables y defina para estas el parmetro y el estadstico respectivo.

4. Indique la verdad o falsedad de las siguientes afirmaciones. Sustente su respuesta.


a. La Inferencia Estadstica se ocupa del clculo de los valores de los parmetros, cuando los datos son
poblacionales.
b. Se dispone de las ventas anuales (en millones de soles) de una empresa XX para el periodo 2008-
2015, que son: 14, 18, 20, 21 20.5, 24, 25 y 28. Luego, estos datos son de corte transversal.

5. Se pretende predecir los resultados de la eleccin de la semana prxima mediante la seleccin de una
muestra de votantes. Cul de los siguientes enunciados corresponde a una de las principales variables
de inters?
a. Por cul de los siguientes candidatos votar Ud.?
b. Seleccionar a todas las personas en edad de votar.
c. Cargo que actualmente desempea en su trabajo actual.
d. Candidato de su preferencia para ser el prximo presidente del Per.
e. Edad de la persona.

6. Considerando el prximo evento nacional en el Per, el 10 de Abril, la poblacin en estudio es?:


a. Todas las personas mayores de 18 aos, peruanos y que estn aptas para votar.
b. Las personas de nacionalidad peruana.
c. Todas las personas mayores de 18 aos que residen en el Per.
d. Todos los peruanos vivos.
e. Ninguna de las anteriores.

7. El Gerente de produccin de una empresa metal mecnica METALSA ha realizado un estudio para
determinar qu medidas correctivas debe aplicar para incrementar la productividad en dicha empresa,
considerando para ello los resultados obtenidos en un estudio. El estudio se realiz en el mes de julio del
presente ao, seleccionndose de ese mes 45 horas laborables en forma aleatoria. Los resultados
obtenidos fueron los siguientes:

El nmero promedio de artculos fabricados por hora fue de 6.76 artculos


El 35% de artculos fabricados fue clasificado como de muy buena calidad, 25% de buena calidad,
20% regular y el resto de mala calidad.
El tiempo promedio empleado en la fabricacin fue de 8.25 minutos por artculo.
El 30% de la produccin fabricada corresponde a puertas de aluminio, el 40% sillas de acero y 30%
restante otros artculos.

Considerando este caso desarrolle los siguientes conceptos:


a. Identifique: La poblacin en estudio, la muestra relacionada y la unidad elemental.
b. Identifique: Las variables de inters indicando luego el tipo de variable.
c. Defina los posibles parmetros para dos variables definidas en b).
d. El resultado obtenido, 35% de artculos fabricados fue clasificado como de muy buena calidad.
Representara un Parmetro o un Estadgrafo (Estadstico)?.Sustente.
e. En el estudio realizado por la empresa mencionada, utilizara la Estadstica Descriptiva o Estadstica
Inferencial? Sustente su respuesta.
8 Anlisis Estadstico - ESAN - 2016

8. Una empresa educativa cuenta con un total de 3750 empleados de los cuales 660 son profesores. Los
directivos saben que el 25% de los profesores usan herramientas tecnolgicas en poca escala. Uno de
sus objetivos es mejorar la calidad de la enseanza, por lo que se ha tomado una muestra aleatoria de
145 profesores y se ha tomado en cuenta, entre otras, las siguientes caractersticas:

Marca de computadora personal que utiliza.


Tiempo que usa la computadora personal por semana.
Nmero de personas, en el hogar, que usan la computadora personal.
Programa principal usado.

Al procesar la informacin muestral se obtuvo un promedio de 18 horas de uso semanal de la


computadora personal, 8,7% usan como programa principal un procesador de texto.
a. Identifique claramente la poblacin y muestra.
b. Identifique las variables del estudio, su tipo.
c. Identifique y defina los estadsticos mencionados en el problema.

9. La cantidad promedio real de lquido en latas de gaseosa debe estimarse utilizando la cantidad promedio
de 25 latas elegidas al azar en una hora de produccin. Haga corresponder las expresiones de la columna
dos con los trminos de la columna uno

1 2

Dato a. Las 25 latas


Unidad de
b. La cantidad de lquido en una lata
anlisis
Muestreo c. La cantidad promedio real de lquido envasado

Parmetro d. 15.9 la cantidad de lquido de una de las 25 latas

Poblacin e. La cantidad promedio de lquido en las 25 latas

Muestra f. Toda la produccin de latas de una hora

Estadgrafo g. Una lata

Variable h. El proceso utilizado para seleccionar las 25 latas y medir sus contenidos

10. Considere el siguiente caso: El Gerente de Ventas de una empresa que embotella y comercializa jugo de
naranja, est interesado en determinar la cantidad promedio real de jugo de naranja por botella, para
esto selecciona aleatoriamente 50 botellas de jugo de naranja de la produccin del da

Teniendo en cuenta este caso los conceptos como: Unidad de Anlisis, dato, poblacin, muestra,
inferencia estadstica, parmetro, estadgrafo, Variable, tipo de variable, estadstica descriptiva,
determine la verdad o falsedad de las siguientes afirmaciones, si considera que la afirmacin es falsa
escriba la afirmacin correcta, solo as se le asignar el puntaje respectivo.

a. Las 50 botellas seleccionadas aleatoriamente por el gerente de ventas es un estadgrafo


b. La cantidad promedio real de lquido envasado, representa un estadgrafo
c. La cantidad de jugo por botella, es la variable de inters en este caso
d. En una botella de la muestra seleccionada se encontr 457cc de jugo de naranja, lo que representa
un estadgrafo
e. Toda la produccin de botellas que fueron llenadas en el da representa el parmetro a estimar
f. El proceso utilizado para seleccionar las 50 botellas y medir sus contenidos se denomina estadstica
inferencial.

You might also like