You are on page 1of 51

2013

MANUAL DE ESTADSTICA

Sistema de Gestin
de la Investigacin
UPN

MANUAL DE
ESTADSTICA
Profesor: MsC. Luis Alberto Rubio Jcobo

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 2 -

PRESENTACIN

El equipo de docentes que coordina las propuestas y la elaboracin de instrumentos para el


Sistema de Gestin de la Investigacin de la Universidad Privada del Norte, tiene el agrado
de presentar la segunda versin del Manual de Estadstica para proyectos de investigacin.

Este manual constituye un material de consulta bsica para docentes y estudiantes de las
diferentes carreras profesionales de nuestra universidad, posibilitando el uso adecuado de la
estadstica, requerida en diversos momentos del proceso investigativo.

Esperamos que con su uso, el presente manual vaya enriquecindose y hacindose ms


familiar para todos los que de una u otra manera estamos involucrados con la investigacin
en todas sus manifestaciones.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 3 -

NDICE
PARTE 1: CONCEPTOS GENERALES ............................................................................................. - 6 1.

DEFINICIN DE ESTADSTICA ............................................................................... - 6 -

2.

CLASIFICACIN DE LA ESTADSTICA ................................................................... - 6 -

3.

UNIVERSO: ............................................................................................................... - 6 -

4.

POBLACIN: ............................................................................................................. - 6 -

5.

MUESTRA ................................................................................................................. - 6 -

6.

MUESTREO .............................................................................................................. - 7 -

7.

UNIDAD DE ESTUDIO .............................................................................................. - 7 -

8.

OBSERVACIONES .................................................................................................... - 7 -

9.

VARIABLE ................................................................................................................. - 7 -

10. PARMETRO ............................................................................................................ - 8 11. ESTIMADOR ............................................................................................................. - 8 12. TCNICAS DE RECOLECCIN DE DATOS:........................................................... - 8 13. INSTRUMENTOS DE RECOLECCIN DE DATOS ................................................. - 9 PARTE 2: PRESENTACIN DE LA INFORMACIN...................................................................... - 10 1.

CUADRO DE DISTRIBUCIN DE FRECUENCIAS (CDF) .................................... - 10 -

2.

PARTES DE UN CUADRO DE DISTRIBUCIN DE FRECUENCIAS.................... - 10 -

3.

ELEMENTOS PARA CONSTRUIR UN CDF ........................................................... - 10 -

4.

PROPIEDADES DE UN CDF .................................................................................. - 11 -

5.

CONSTRUCCIN DE CUADROS DE FRECUENCIAS ......................................... - 11 -

6.

CONSTRUCCIN DE CDF CON EXCEL ............................................................... - 12 -

7.

GRFICO ESTADSTICO ....................................................................................... - 21 -

8.

PARTES DE UN GRFICO ESTADSTICO............................................................ - 21 -

9.

CRITERIOS PARA CONSTRUIR GRFICOS ........................................................ - 21 -

10. TIPOS DE GRAFICOS ESTADSTICOS................................................................. - 22 11. CONSTRUCCIN DE GRFICOS ESTADSTICOS DE EXCEL ........................... - 22 PARTE 3: MEDIDAS ESTADSTICAS ............................................................................................. - 24 1. MEDIDAS DE TENDENCIA CENTRAL ..................................................................... - 24 2. MEDIDAS DE LOCALIZACIN ................................................................................. - 24 4. MEDIDAS DE VARIABILIDAD ................................................................................... - 25 5. MEDIDAS DE FORMA ............................................................................................... - 25 6. FRMULAS PARA CALCULAR LAS MEDIDAS DE TENDENCIA CENTRAL: ........ - 26 7. FRMULAS PARA CALCULAR LAS MEDIDAS DE DISPERSIN O VARIACIN . - 27 8. MEDIDAS ESTADSTICAS CON MEGASTAT .......................................................... - 28 9. APLICACIN: (Evaluacin de un caso) ..................................................................... - 28 -

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 4 -

PARTE 4: ANLISIS DE CORRELACIN Y REGRESIN ............................................................ - 31 1.

ANLISIS DE CORRELACIN ............................................................................... - 31 -

2.

ANLISIS DE REGRESIN .................................................................................... - 31 -

PARTE 5: DISTRIBUCIONES DE PROBABILIDAD ....................................................................... - 34 1.

LA DISTRIBUCIN BINOMIAL ............................................................................... - 34 -

2.

LA DISTRIBUCIN POISSON ................................................................................ - 36 -

3.

LA DISTRIBUCIN NORMAL ................................................................................. - 39 -

4.

LA DISTRIBUCIN NORMAL ESTNDAR ............................................................ - 39 -

5.

APLICACIN CON MEGASTAT ............................................................................. - 40 -

PARTE 6: ESTIMACIN ESTADSTICA ......................................................................................... - 42 1.

ESTIMACION PUNTUAL......................................................................................... - 42 -

2.

ESTIMACIN INTERVLICA .................................................................................. - 42 -

3.

APLICACIN UTILIZANDO MEGASTAT ................................................................ - 44 -

PARTE 7: DETERMINACIN DEL TAMAO DE MUESTRA ........................................................ - 47 1.

MUESTREO ............................................................................................................ - 47 -

2.

TCNICAS DE MUESTREO ................................................................................... - 47 -

3.

DETERMINACIN DEL TAMAO DE MUESTRA ................................................. - 47 -

5.

FRMULAS PARA DETERMINAR EL TAMAO DE MUESTRA .......................... - 48 -

6.

PASOS A SEGUIR PARA DETERMINAR LA MUESTRA PTIMA ....................... - 48 -

7.

APLICACIN UTILIZANDO MEGASTAT ................................................................ - 49 -

PARTE 8: PRUEBA DE HIPTESIS................................................................................................ - 51 1.

DEFINICIONES PRELIMINARES ........................................................................... - 51 -

2.

CLASES DE HIPTESIS ........................................................................................ - 51 -

3.

ERRORES QUE SE COMETEN EN UNA PRUEBA DE HIPTESIS: ................... - 51 -

5.

TIPOS DE PRUEBAS DE HIPTESIS: .................................................................. - 52 -

6.

ETAPAS DE UNA PRUEBA DE HIPTESIS: ......................................................... - 52 -

8.

FRMULAS DE ALGUNOS ESTADSTICOS DE PRUEBA ................................... - 53 -

9.

PRUEBA DE HIPTESIS CON MEGASTAT .......................................................... - 54 -

10. APLICACIN UTILIZANDO MEGASTAT ................................................................ - 55 -

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 5 -

PARTE 1: CONCEPTOS GENERALES


1.

DEFINICIN DE ESTADSTICA
La Estadstica es una ciencia que nos ofrece un conjunto de mtodos y tcnicas para recopilar,
organizar, presentar, analizar e interpretar un conjunto de datos respecto a variables en estudio
de una poblacin, con el fin de obtener conclusiones y tomar decisiones sobre determinados
hechos o fenmenos en estudio.
La estadstica es una rama de la matemtica y es parte del mtodo cientfico. En la actualidad,
para hacer investigacin cientfica se necesita conocer de estadstica.

2.

CLASIFICACIN DE LA ESTADSTICA
La Estadstica se clasifica de la siguiente manera:
2.1. Estadstica Descriptiva
Es aquella rea de la Estadstica que describe y analiza una poblacin, sin pretender
sacar conclusiones de tipo general. Es decir, las conclusiones obtenidas son vlidas slo
para dicha poblacin.
2.2. Estadstica Inferencial
Es aquella rea de la Estadstica, cuyo propsito es inferir o inducir leyes de
comportamiento de una poblacin, a partir del estudio de una muestra. Es decir las
conclusiones obtenidas a partir de una muestra, son vlidas para toda la poblacin.

3.

UNIVERSO:
Es el conjunto de individuos, objetos o entes que tienen caractersticas comunes, definidas en
forma general en un espacio y tiempo.
Ejemplo:
Conjuntos de alumnos, conjunto de docentes universitarios, conjunto de pacientes, conjunto de
clientes, conjunto de proveedores, conjunto de viviendas, conjunto de establecimientos,
conjunto de documentos, etc.; de una determinada regin o zona en un tiempo determinado.

4.

POBLACIN:
Es un conjunto grande y completo de individuos, elementos o unidades que presentan como
mnimo una caracterstica en comn y observable. Para definir una poblacin esta debe
contener los siguientes elementos: contenido, espacio y tiempo. Al nmero de elementos de
una poblacin de denota por N. Una poblacin puede clasificarse de la siguiente manera:
A.
Segn su extensin:
Poblacin Finita:
Es aquella que tiene un determinado nmero de elementos.
Poblacin Infinita:
Es aquella cuyos elementos no se pueden contar.
B.
Segn su mbito o naturaleza:
Poblacin Objeto:
Esta dada por los elementos que forman la poblacin.
Poblacin Objetivo: est dada por la informacin que da la poblacin objeto
Nota: De un universo se pueden desprender muchas poblaciones, pero operativamente se
pueden hablar indistintamente como poblacin o universo.

5.

MUESTRA
Es una parte o un subconjunto de la poblacin en estudio. Tambin se puede decir que es una
coleccin de unidades de muestreo seleccionados de un marco muestral o de varios marcos
muestrales. Al nmero de elementos de la muestra se denota por n. Una muestra tiene las
siguientes caractersticas:
a. Es representativa.
b. Es adecuada.
Para la determinacin del tamao de muestra se utilizan tcnicas de muestreo donde
dependiendo de esta, se utiliza correctamente las frmulas adecuadas.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 6 -

6.

MUESTREO
Es una tcnica estadstica por la cual se realizan inferencias o generalizaciones para una
poblacin examinando solo una muestra de ella. Es una tcnica empleada para seleccionar
elementos de una poblacin.
Su propsito es proporcionar diferente tipo de informacin estadstica de naturaleza cuantitativa
o cualitativa. Por su gran importancia los investigadores lo utilizan en los diferentes campos de
saber y tambin lo usamos en la vida diaria.

7.

UNIDAD DE ESTUDIO
Es el animal persona o cosa de quien se dice algo. Es el elemento quien nos va a dar la
informacin. Es el individuo u objeto del cual se toman las mediciones u observaciones.
Ejemplos:
Un docente, un auxiliar de educacin, un votante, una factura, una empresa, una botella de
cerveza, una universidad, una vaca, una gota de sangre, etc.

8.

OBSERVACIONES
Estadsticamente son los datos que se recolectan para un estudio. Una observacin o dato es
cuando una variable en s toma un valor especfico.

9.

VARIABLE
Una variable es una caracterstica de estudio de una poblacin. Una variable es lo que se
quiere evaluar en una investigacin. Las caractersticas toman diferentes valores que varan de
individuo a individuo o de objeto a objeto. Aquellas caractersticas que permanecen inalterables
en las unidades de estudio reciben el nombre de constantes.
Generalmente, las variables se designan con las ltimas letras maysculas del abecedario: X,
Y, Z; y los valores de las variables se designan con letras minsculas: xi, yi, etc.
Las variables se clasifican de la siguiente manera:
Por su relacin: variable dependiente - variable independiente.
Por su escala de medicin: Nominal Ordinal Intervalo Razn.
Por su naturaleza: Cuantitativas - Cualitativas.
Ejemplos:
Unidad de estudio
Variable
Estudiante
Peso, talla, edad, ci, nmero de hermanos, raza, color de ojos, tipo de
sangre, etc.
Empresa
Ganancia, costos, produccin, nmero de trabajadores, nmero de
computadoras, etc.
PYME
Nmero de trabajadores, aos de funcionamiento, ganancias, etc.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 7 -

10.

PARMETRO
Es un valor, una cantidad, un indicador que se obtiene con informacin de la poblacin. Dentro
de estos tenemos:
a. El promedio poblacional
b. La varianza poblacional.
c. La proporcin poblacional, etc.

11.

ESTIMADOR
Es un valor, una cantidad, un indicador que se obtiene con informacin de la muestra. Dentro
de estos tenemos:
a. El promedio muestral.
b. La varianza muestral.
c. La proporcin muestral, etc.

12.

TCNICAS DE RECOLECCIN DE DATOS:


Las tcnicas de recoleccin de datos permiten la obtencin sistemtica de informacin acerca
de los objetos de estudio (personas, objetos y fenmenos) y de su entorno.
Como ya se mencion, la recoleccin de datos tiene que ser sistemtica, ya que, si los datos se
recolectan al azar ser difcil responder las preguntas de investigacin de una manera
concluyente.
Las tcnicas de recoleccin de datos son
1. Utilizacin de la informacin disponible
2. Observacin
3. Entrevista( cara a cara)
4. Cuestionarios auto administrados
5. Discusin con grupos focales
6. Otras
OBSERVACIN
La observacin es una tcnica que implica seleccionar ver y registrar sistemticamente la
conducta y caractersticas de seres vivos, objetos o fenmenos. La observacin de la conducta
humana es una tcnica de recoleccin de datos muy utilizada que puede llevarse a cabo de
diferentes formas:
a. Observacin participativa: El observador participa en la situacin que observa.
b. Observacin no participativa: El observador no participa en la situacin que observa.
Las observaciones pueden servir para diferentes propsitos. Pueden dar informacin adicional
y ms confiable de la conducta de las u.e. que las entrevistas o los cuestionarios. Los
cuestionarios pueden ser incompletos ya que se pueden olvidar algunas preguntas o porque
los entrevistados olvidan o no desean contestar algunas cosas. Con la observacin se puede,
entonces, verificar la informacin recolectada (especialmente sobre temas como alcoholismo,
drogadiccin, sida,) pero tambin puede ser una fuente primaria de informacin (observacin
sistemtica de los juegos de los nios).
La observacin de la conducta humana puede formar parte de algn estudio, pero como
consume tiempo se usa con mayor frecuencia en estudios de pequea escala.
ENTREVISTA
La entrevista es una tcnica de recoleccin de datos que involucra el cuestionamiento oral de
los entrevistados ya sea individualmente o en grupo. Las respuestas a las preguntas durante la
entrevista pueden ser registradas por escrito o grabadas en una cinta. La entrevista puede
conducirse con diferentes grados de flexibilidad.
Las entrevistas utilizan una cdula para asegurar que se discuten todos los puntos, pero dando
suficiente tiempo y permitiendo seguir cualquier orden. El entrevistador puede hacer preguntas
adicionales para obtener tanta informacin adicional como sea posible, Las preguntas son
abiertas y no hay restricciones para las respuestas.
Este mtodo poco estructurado de hacer las preguntas puede ser til para entrevistas
individuales o grupales con informantes claves.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 8 -

Un mtodo de entrevista flexible es til si el investigador sabe poco del problema o de la


situacin que est investigando. Se aplica en estudios exploratorios y en los estudios de caso.
ENCUESTAS
Hoy en da la palabra "encuesta" se usa ms frecuentemente para describir un mtodo de
obtener informacin de una muestra de individuos. Esta "muestra" es usualmente slo una
fraccin de la poblacin bajo estudio. Una "encuesta" recoge informacin de una "muestra."
Una "muestra" es usualmente slo una porcin de la poblacin bajo estudio.
Las encuestas pueden ser clasificadas de muchas maneras. Una dimensin es por tamao y
tipo de muestra. Las encuestas pueden ser usadas para estudiar poblaciones humanas o no
humanas (por ejemplo, objetos animados o inanimados, animales, terrenos, viviendas).
Mientras que muchos de los principios son los mismos para todas las encuestas, el foco aqu
ser en mtodos para hacer encuestas a individuos. Las encuestas pueden ser clasificadas por
su mtodo de recoleccin de datos. Las encuestas por correo, telefnicas y entrevistas en
persona son las ms comunes. En los mtodos ms nuevos de recoger datos, la informacin
se entra directamente a la computadora ya sea por un entrevistador adiestrado o an por la
misma persona entrevistada. Un ejemplo bien conocido es la medicin de audiencias de
televisin usando aparatos conectados a una muestra de televisores que graban
automticamente los canales que se observan.
OTRAS TCNICAS DE RECOLECCION DE DATOS
a. Tcnica de grupo nominal.
b. Tcnica Delphi.
c. Historias de vida.
d. Escalas.
e. Ensayos.
f. Estudios de casos.
g. Mapeo.
h. Tcnicas rpidas de evaluacin de sondeo.
i. Encuestas participativas.
13.

INSTRUMENTOS DE RECOLECCIN DE DATOS


Si tenemos presente el tema de investigacin por el que nos estamos guiando se percibir que,
una vez obtenidos los indicadores de los elementos tericos y definido el diseo de la
investigacin, se har necesario estructurar las tcnicas d recoleccin de datos
correspondientes, para as poder construir los instrumentos que nos permitan obtener tales
datos de la realidad.
Un instrumento de recoleccin de datos es, en principio, cualquier recurso del que pueda
valerse el investigador para acercarse a los fenmenos y extraer de ellos informacin. Ya
adelantbamos que dentro de cada instrumento concreto pueden distinguirse dos aspectos
diferentes: una forma y un contenido.
La forma del instrumento se refiere al tipo de aproximacin que establecemos con lo emprico,
a las tcnicas que utilizamos para esta tarea; una exposicin ms detallada de las principales
es la que se ofrece al lector en este mismo captulo. En cuanto al contenido ste queda
expresado en la especificacin de los datos concretos que necesitamos conseguir; se realiza,
por lo tanto, en una serie de tems que no son otra cosa que los indicadores bajo la forma de
preguntas, de elementos a observar, etc.
De este modo, el instrumento sintetiza en s toda la labor previa de investigacin: resume los
aportes del marco terico al seleccionar datos que corresponden a los indicadores y, por lo
tanto, a las variables o conceptos utilizados; pero tambin expresa todo lo que tiene de
especficamente emprico nuestro objeto de estudio, pues sintetiza a travs de las tcnicas de
recoleccin que emplea, el diseo concreto escogido para el trabajo.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 9 -

PARTE 2: PRESENTACIN DE LA INFORMACIN


En la Estadstica se trabaja generalmente con una gran cantidad de datos los cuales por facilidad de
anlisis y clculos se organizan en Cuadros de Distribucin de Frecuencias (CDF) y Grficos
Estadsticos (GE).
1.

CUADRO DE DISTRIBUCIN DE FRECUENCIAS (CDF)


Un cuadro de distribucin de frecuencias, es una tabla resumen rectangular de un conjunto de
datos que muestra el comportamiento o distribucin de la variable en estudio en forma rpida y
resumida.
Aun cuando un cuadro de frecuencias se construye a libre criterio de quien lo ejecuta,
generalmente es comn seguir algunos pasos que de alguna forma homogenizan criterios y
ayudan a los fines didcticos.
Para realizar este anlisis se tiene que tener en cuenta el tipo de variable que se est
evaluando.

2.

PARTES DE UN CUADRO DE DISTRIBUCIN DE FRECUENCIAS


Las partes de un CDF son las siguientes:
a. Nmero del cuadro de frecuencias en forma correlativa.
b. Ttulo: Especificar la variable y la poblacin en estudio.
c. Encabezado o conceptos.
d. Cuerpo o contenido del cuadro de frecuencias.
e. Nota de pie (no siempre es necesaria).
f. Fuente.
g. Elaboracin.

3.

ELEMENTOS PARA CONSTRUIR UN CDF


Para construir un cuadro de frecuencias se utilizan los siguientes elementos:
a. Valores de la variable Xi
Los valores de la variable o datos se representan por Xi. Ejm: Si se tienen 50 datos sus
valores correspondientes no agrupados se representan como X 1, X2, X3,..., X50.
b. Intervalos de clase
Los intervalos son subconjuntos de la recta real Ron que estn definidos por un lmite
menor o inferior Li y un lmite mayor o superior Ls.
c. Frecuencia
1. Frecuencia absoluta simple
Se denota por fi. Est constituida por el nmero de veces que se repite un valor. En el
caso de intervalos es el nmero de observaciones comprendidas en dicho intervalo.
Estas frecuencias siempre son enteros positivos y adems la suma de todos ellos es
el tamao de la muestra n.
2. Frecuencia relativa
Se denota por hi. Indica la relacin o proporcin existente entre la frecuencia absoluta
simple y el nmero total de datos. Estas frecuencias son nmeros fraccionarios
positivos entre o y 1. Para fines interpretativos estas frecuencias se expresan en %
(hi%). As:

hi

fi
n

hi(%)

fi
x100
n

3. Frecuencia absoluta acumulada


Se denota por Fi. Resulta de la suma de las frecuencias cuyas marcas de clase
son iguales o menores a la marca de clase del intervalo dado o considerado, es
decir:
F1 = f 1
F2 = f 1 + f 2
F3 = f 1 + f 2 + f 3

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 10 -

.............................................

Fj = f1 + f2 + f3 + ....... + fi
4. Frecuencia relativa acumulada
Se denota Hi. Resulta de la suma de las frecuencias relativas simples hasta la
frecuencia del intervalo considerado. As:
H4 = h1 + h2 + h3 + h4
H6 = h1 + h2 +....+ h6
Para fines interpretativos estas frecuencias se expresan en % (Hi%)
d. Marca de clase
Se denota por Yi. Es el promedio de los valores correspondientes a los lmites inferior y
superior de cada uno de los intervalos determinados.
4.

PROPIEDADES DE UN CDF
a. Las fi y Fi son siempre nmeros enteros positivos. Es decir: fi, Fi 0.
b. Las hi y Hi son siempre nmeros fraccionarios positivos comprendidos entre 0 y 1, es decir
0 hi, Hi 1.
c. F1 siempre es igual f1 y H1 siempre es igual a h1.
d. La suma de todas las fi es igual a n y la suma de las hi es igual a 1.
e. Fm siempre es igual a n y Hm siempre es igual a 1.

5.

CONSTRUCCIN DE CUADROS DE FRECUENCIAS


Para la construccin de los CDF hay que tener en cuenta el tipo de variable que se esta
analizando, es decir, si es cuantitativa continua, cuantitativa discreta o variable cualitativa.
a. CDF PARA UNA VARIABLE CUANTITATIVA CONTINUA
Para la construccin de este cuadro hay que realizar los siguientes pasos:
PASO 1. Determinar el Rango del conjunto de datos.
R = Valor mximo - Valor mnimo
PASO 2. Determinar el nmero de intervalos m.

m =

1 + 3.322 log ( n )

Este valor siempre es un nmero entero (Redondeo)


PASO 3. Determinar la amplitud A intervlica (de cada intervalo).

A = R/m
Este valor est en funcin de la estructura de la base de datos (tomar el
inmediato superior)
PASO 4. Determinar el nuevo rango R2 (Solamente si se tom un inmediato
superior)
R2 = A * m
A: es la amplitud teniendo en cuenta el inmediato superior.
PASO 5. Determinar los intervalos y finalmente construir el cuadro.
b. Cdf para una variable cuantitativa discreta
Para la construccin de un CDF para una variable cuantitativa discreta (valores
discretos) ya no se utiliza los pasos anteriores solamente colocar en los intervalos a los
diferentes valores discretos.
c. Cdf para una variable cualitativa
Para la construccin de un CDF para una variable cualitativa se sigue los mismos pasos
que para una variable cuantitativa discreta, es decir, solamente colocar en los en los
intervalos a las diferentes categoras de la variable cualitativa.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 11 -

6.

CONSTRUCCIN DE CDF CON EXCEL


Si bien es cierto que el EXCEL no es un programa exclusivamente diseado para anlisis de
datos, es muy utilizado dentro del anlisis de estos cuando se realiza una investigacin
cientfica. Una de las ventajas y razones de su uso, est en su fcil acceso, pues en todas las
computadoras est instalado y as se podr explorar el funcionamiento de las herramientas que
se presentan en este programa.
A.

CONSTRUCCIN DE CUADROS DE FRECUENCIA UTILIZANDO TABLAS DINMICAS

Para construir cuadros de distribucin de frecuencias a travs de Excel se utiliza la


herramienta TABLAS DINMICAS.
Teniendo en cuenta esta base de datos realizar los siguientes pasos:
Hacemos clic en Insertar /tabla dinmica. aparece la siguiente pantalla:

Luego aparecen las siguientes ventanas de trabajo.activamos (a) lista de base de


datos de Excel y (b) Tabla Dinmica. Luego siguiente seleccionamos el rango
respectivo, luego siguiente..luego seleccionamos la opcin diseo.
En la opcin diseo seleccionamos la variable que
vamos a analizar y con el cursor activamos dicha
variable y lo arrastramos hasta la opcin FILA y luego
la misma variable la arrastramos hasta la opcin
DATOS. Finalmente aceptamos y obtenemos los
resultados.

En funcin a lo que se quiera obtener como


resultados de la variable analizada, se selecciona
OPCIONES DE TABLA DINMICA para obtener
ya sea totales, promedio o frecuencia de dicha
variable. Esta ventana de trabajo es la siguiente:

B.

CONSTRUCCIN DE CUADROS DE FRECUENCIA UTILIZANDO MEGASTAT

Para construir cuadros de distribucin de frecuencias con Megaestat se utiliza la opcin


Complementos/MegaStat Distribucin de Frecuencias.
Luego se debe seleccionar para variables cuantitativas o variables cualitativas.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 12 -

Si se selecciona variable cuantitativa se aprecia la siguiente ventana, donde debemos


ingresar el rango de los datos de la variable, luego se hace la seleccin de datos
respectiva y activamos algn tipo de grfico. Se pueden realizar algunas modificaciones
al CDF dependiendo del investigador como tamao de intervalos, nmero de intervalos,
lmite superior, lmite inferior, etc.
7.

GRFICO ESTADSTICO
Un grfico estadstico es una representacin pictrica, cuyo objetivo es expresar el
comportamiento de una variable en estudio.
Los grficos estadsticos son representaciones de informacin real que existe en nuestro
mundo, es una expresin artstica de datos reales y observados.
Un grfico sirve
tambin
para
comparar
visualmente
el
comportamiento de
dos o ms variables
similares
o
relacionadas.

8.

PARTES DE UN GRFICO ESTADSTICO


Numeracin.
Ttulo: Aqu se seala la poblacin en estudio y la variable de inters.
Diagrama: est dado por el propio dibujo, el cual representa el comportamiento de los
datos.
Escalas y/o leyendas: Son indicadores donde se precisa la correspondencia entre los
elementos del grfico y la naturaleza de las medidas representadas.
Fuente: Aqu se seala el CDF que permiti obtener el respectivo grfico.

9.

CRITERIOS PARA CONSTRUIR GRFICOS


No existe una regla especfica para la construccin de grficos, pero si es posible
considerar algunas recomendaciones o criterios.
Se emplea una diversidad de grficos, cuya estructura o forma depender del tipo de
variable que se est estudiando.
Este grfico debe tener rasgos simples y de fcil comprensin.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 21 -

10.

TIPOS DE GRAFICOS ESTADSTICOS


Hay varias tipos de grficos, los cuales dependen del tipo de variable que se est evaluando.
Presentaremos aqu los ms importantes:
a. Grfico de bastones: Se utiliza cuando se tienen datos de una variable cuantitativa
discreta.
b. Histograma: Se utiliza cuando se tienen datos de una variable cuantitativa continua.
c. Grfico de Barras: Se utiliza cuando se tienen datos de una variable cualitativa.
d. Grfico Sectorial o Pastel: Se utiliza cuando se tiene informacin de una variable
cualitativa o cuantitativa discreta.
e. Polgono de frecuencias: Se utiliza para indicar el comportamiento de un conjunto de
datos.
f. Grfico de series de tiempo: Se utiliza para analizar variables cuantitativas continuas
pero expresadas en el tiempo.
g. Grfico de Cajas y Bigote: Se utiliza para analizar el comportamiento de una variable
cuantitativa. Se obtiene en base a los cuartiles.
h. Grfico de la telaraa: Sirve para visualizar el comportamiento de una variable
cuantitativa cuando evala ciertos criterios de evaluacin.

11.

CONSTRUCCIN DE GRFICOS ESTADSTICOS DE EXCEL


Excel puede crear grficos a partir de datos previamente seleccionados en una hoja de clculo.
El usuario puede insertar un grfico en una hoja de clculo, o crear el grfico en una hoja
especial para grficos. En cada caso el grfico queda vinculado a los datos a partir de los
cuales fue creado, por lo que si en algn momento los datos cambian, el grfico se actualizar
de forma automtica. Los grficos de Excel contienen muchos objetos, ttulos, etiquetas en los
ejes que pueden ser seleccionados y modificados individualmente segn las necesidades del
usuario.
Para crear un grfico con el Asistente para Grficos, se deben seguir los siguientes pasos:
1. Seleccionar los datos a representar.
2. Ejecutar el comando Insertar / Grfico o hacer clic en el botn
A continuacin aparece el siguiente cuadro de dilogo del Asistente para Grfico que permite
elegir el tipo y subtipo de grfico que se va a utilizar entre dos listas que son estndares y
personalizados.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 22 -

Luego seleccionar el rango de los datos a evaluar, sealando correctamente las series que
estn evaluando.

Luego debemos configurar los aspectos que conciernen a la presentacin del grfico,
aportando una vista preliminar del mismo. As, se determinan el ttulo, las inscripciones de los
ejes, la apariencia de stos, la leyenda, la aparicin o no de tabla de datos y los rtulos. Las
opciones de <Atrs, Siguiente> y Finalizar son las mismas que en los otros cuadros.
Finalmente hacer clic en el botn Finalizar, el grfico aparece ya en el lugar seleccionado. Si
se quiere desplazar a algn otro lugar sobre la propia hoja en que se encuentra basta
seleccionar todo el grfico y arrastrarlo con el mouse.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 23 -

PARTE 3: MEDIDAS ESTADSTICAS


La estadstica descriptiva es una tcnica que consiste en obtener indicadores que describen el
comportamiento de un conjunto de datos. Dentro de estas medidas estadsticas tenemos:
A. Las medidas de Posicin: Dentro de estas tenemos:
a. Medidas de tendencia central: media, moda, mediana.
b. Medidas de localizacin: cuartiles, deciles y percentiles.
B. Las medidas de variacin: rango, varianza, desviacin estndar, coeficiente de variacin.
C. Las medidas de deformacin: asimetra y kurtosis.
1.

2.

MEDIDAS DE TENDENCIA CENTRAL


1.1. MEDIA ARITMTICA
Se denota por x
Es la medida estadstica ms fcil de calcular.
La media o promedio es el punto central de un conjunto de datos.
Para calcular la media aritmtica se utilizan las frmulas adecuadas
datos agrupados o datos no agrupados.
1.2. MEDIANA
Se denota por Me.
Es un valor que divide al conjunto de datos en dos partes iguales,
segmento tiene el 50% de los datos.
Para calcular la media aritmtica se utilizan las frmulas adecuadas
datos agrupados o datos no agrupados.
1.3. MODA
Se denota por Mo.
La moda es el valor que ms se repite en un conjunto de datos.
En un conjunto de datos se presentan los siguientes casos:
a. No existir datos
Amodal
b. 1 moda
Unimodal.
c. 2 modas
Bimodal
d. 3 a ms modas
Multimodal
Para calcular la media aritmtica se utilizan las frmulas adecuadas
datos agrupados o datos no agrupados.

ya sea sin son

es decir, cada
ya sea sin son

ya sea sin son

MEDIDAS DE LOCALIZACIN
2.1. CUARTILES
Se denotan por Qk, donde k=1,2,3
Son valores que dividen a un conjunto de datos en 4 partes iguales, es decir, cada
sector tiene el 25% de los datos.
Para calcular la media aritmtica se utilizan las frmulas adecuadas ya sea si son
datos agrupados o datos no agrupados.
2.2. DECILES
Se denotan por Dk, donde k=1,2,3,4,5,6,7,8,9
Son valores que dividen a un conjunto de datos en 10 partes iguales, es decir, cada
sector tiene el 10% de los datos.
2.3. PERCENTILES
Se denotan por Pk, donde k=1,2,3,4,5,6,7,8,9,10, , 99
Son valores que dividen a un conjunto de datos en 100 partes iguales, es decir,
cada sector tiene el 1% de los datos.
Para calcular la media aritmtica se utilizan las frmulas adecuadas ya sea sin son
datos agrupados o datos no agrupados.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 24 -

4.

MEDIDAS DE VARIABILIDAD
3.1. RANGO
Se denota por R y la medida de variabilidad ms fcil de calcular.
Es la diferencia que existe entre el valor mximo y el valor mnimo del conjunto de
datos.
3.2. VARIANZA
Mide la variabilidad de un conjunto de datos respecto a un valor central (promedio)
Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto es ilgica
su interpretacin.
Para calcular la media aritmtica se utilizan las frmulas adecuadas ya sea sin son
datos agrupados o datos no agrupados.
3.3. DESVIACIN ESTNDAR
Mide la variabilidad de un conjunto de datos respecto a su valor central pero en
unidades originales.
Esta es la medida de variabilidad que tiene una interpretacin lgica.
Se obtiene al obtener la raz cuadrada de la varianza.
3.4. COEFICIENTE DE VARIACIN
Se denota por C.V.
El C.V. sirve para determinar si un conjunto de datos tiene un comportamiento
homogneo o heterogneo.
Para llegar a determinar la homogeneidad se compara con un valor convencional
del 33%.
Si el CV 33% el conjunto de datos tiene un comportamiento homogneo.
Si el CV > 33% el conjunto de datos tiene un comportamiento heterogneo.

5.

MEDIDAS DE FORMA
4.1. ASIMETRA
La asimetra se entiende como la deformacin horizontal de un conjunto de datos.
Para conocer esta asimetra se calcula el coeficiente de asimetra As.
En un conjunto de datos pueden presentar los siguientes casos:
a. As= 0, el conjunto de datos es simtrica.
b. As<0, el conjunto de datos es asimtrica negativa.
c. As>0, el conjunto de datos es asimtrica positiva.

As

X Mo
S

As

3( X Me)
S

As

Q3 2Q2 Q1
Q3 Q1

4.2. KURTOSIS
Se entiende por Kurtosis a la deformacin vertical de un conjunto de datos, es decir,
mide el apuntamiento o achatamiento de un conjunto de datos.
Para conocer qu tipo de asimetra tiene un conjunto de datos, se utilizan las
siguientes formulas:
A. Kurtosis en funcin de los momentos
Si K1>3, el conjunto de datos es leptocrtica.
Si K1=3, el conjunto de datos es mesoctica.
Si K1<3, el conjunto de datos es platicrtica.

K1

M4
(M 2 )2

M4: Momento de orden cuatro respecto a la media.


M2: Momento de orden dos respecto a la media.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 25 -

B. Kurtosis en funcin de los momentos de orden 4


Si K2>0, el conjunto de datos es leptocrtica.
Si K2=0, el conjunto de datos es mesoctica.
Si K2<0, el conjunto de datos es platicrtica.

K2

M4
3
( s) 2

C. Kurtosis en funcin de los cuantiles

Si K3>0.263, el conjunto de datos es leptocrtica.

Si K3=0.263, el conjunto de datos es mesocrtica.

Si K3<0.263, el conjunto de datos es platicrtica.

As

6.

Q3 Q1
2( P90 P10 )

FRMULAS PARA CALCULAR LAS MEDIDAS DE TENDENCIA CENTRAL:


MEDIDAS

PARA DATOS NO AGRUPADOS

PARA DATOS AGRUPADOS


m

PROMEDIO

xi

i 1

Xi: datos
n = nmero de datos
Procedimiento:
Observar la base de datos y determinar
el valor que ms se repite.

Y f
i

i i

Yi: Marca de clase o punto medio


fi: frecuencia absoluta simple
n: nmero de datos.

1
Mo Li A

1 2
Li: lmite inferior del intervalo modal.
A: amplitud intervlica

MODA

1 f j f j 1

2 f j f j 1

MEDIANA

Procedimiento:
Ordenar la serie en forma
ascendente
Cuando n impar:
Me = valor central
Cuando n par:
Me = promedio de los valores
centrales

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

n / 2 F j 1
Me Li A

fj

Li: lmite inferior del intervalo mediano.


A: amplitud intervlica.

n / 2 es el elemento determinante
Fj-1: Frecuencia acumulada anterior al intervalo mediano
fj: Frecuencia abs. simple del intervalo mediano

pg. - 26 -

QUARTILES

kn / 4 F j 1
QK Li A

fj

Seguir pasos similares a la mediana.

CUANTILES

Similar a la Me. Lo nico que cambia es el elemento


determinante.

DECILES

kn / 10 F j 1
DK Li A

fj

Seguir pasos similares a la mediana.

Similar a la Me. Lo nico que cambia es el elemento


determinante.

PERCENTIL
ES

kn / 100 F j 1
PK Li A

fj

Seguir pasos similares a la mediana.

Similar a la Me. Lo nico que cambia es el elemento


determinante.

7.

FRMULAS PARA CALCULAR LAS MEDIDAS DE DISPERSIN O VARIACIN


MEDIDAS

PARA DATOS NO AGRUPADOS

RANGO

R V max V min

POBLACIONAL

i 1

R LS LI
Ls: Lmite superior
Li: Lmite inferior
m

(X

PARA DATOS AGRUPADOS

u)

(Y u)

i 1

Xi : Datos de la poblacin
u : promedio poblacional
N: Nmero de elementos de la poblacin
VARIANZA

s2

(x
i 1

x)

* fi

Yi : Marca de clase
u : promedio poblacional
N: Nmero de elementos de la poblacin
fi: frecuencia absoluta simple
m

(y
i 1

y)2 * fi

n 1

n 1

MUESTRAL
Xi : Datos de la muestra
x : promedio muestral
n : Nmero de elementos de la muestra

Frmulas
abreviadas

DESVIACIN ESTNDAR

( xi ) 2
n
1
s2
xi2 i1n
n 1 i 1

2
D.E. Poblacional

COEFICIENTE DE
VARIACIN

C.V .

*100

C.V. Poblacional

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

yi: Marca de clase


y : promedio muestral
n : Nmero de elementos de la muestra
fi: frecuencia absoluta simple
m

( yi f i ) 2
m
1
s2
yi2 fi i1 n
n 1 i 1

s s2
D.E. Muestral

C.V .

s
*100
x

C.V. Muestral

pg. - 27 -

8.

MEDIDAS ESTADSTICAS CON MEGASTAT


En Excel los pasos a seguir para obtener estas medidas son los siguientes:
a. Tener una base de datos respecto a variables cuantitativas.
b. Seleccionar en MegaStat / Estadstica descriptiva/. aparece la siguiente ventana, luego
hay que ingresar los datos respectivos:

9.

APLICACIN: (Evaluacin de un caso)


RUBIOJA S.A. es una de las firmas consultoras financieras ms importantes del Per. Ofrece asesora
financiera y servicios a firmas particulares y a gobiernos regionales. Grecia Rubio, acababa de ser
encargada del departamento de personal de esta empresa. En los tres aos pasados, se han agregado
otros ayudantes y hace seis semanas, se sum al departamento un estadstico recin graduado. Damne
empez hace poco a revisar las prcticas de contratacin del departamento. Empez la revisin
examinando el campo ms crtico, las personas en adiestramiento financiero. La firma contrata entre 60 y
130 de estas personas al ao, segn sea el crecimiento de la firma, el movimiento de empleados y el
nmero de perspectivas notables" que encuentre. Prcticamente todos los que estn en adiestramiento
financiero se contratan entre los estudiantes del ltimo ao de escuelas superiores con especializacin
financiera. Damne seleccion al azar 100 de los 197 candidatos que haban sido contratados hace dos aos
y an seguan trabajando.
Cada ficha contena la informacin siguiente (los datos van en el apndice adjunto):
1. Gnero. (0=Femenino y 1=Masculino)
2. Edad al contratarse.
3. Promedio ponderado de sus notas universitarias (escala de 0 a 20).
4. Calidad de la universidad de procedencia. (1=Excelente, 2=Muy buena, 3=Buena y 4=Regular)
5. Nota de la prueba de aptitudes. La prueba produce una puntuacin de 0 (muy improbable que tenga
xito en el trabajo) a 100 (muy probable que tenga xito en el trabajo).
6. Evaluacin del rendimiento al final del segundo ao. Esta evaluacin produce una puntuacin
numrica desde 0 (muy malo) hasta 100 (excelente).
La Gerencia de RUBIOJA S.A. estn seguros de que la escala es de intervalo y tambin han decidido, con
base en los tres aos de experiencia con dicha escala, que una puntuacin inferior a 50 es insatisfactoria,
50-69 es satisfactoria, 70-89 por sobre el promedio, y por encima de 89 es excelente. Grecia llama al
estadstico a su oficina y le dice: "Estoy encantada de tener un estadstico que nos ayude. No estamos an
listos a desarrollar un modelo estadstico acabado de lo que constituye una buena contratacin, pero es
tiempo de empezar a evaluar algunas de las variables de que tenemos informacin. El gran nmero de
personas que contratamos, el alto costo de adiestrarlas y el hecho de que no podemos evaluar realmente
los rendimientos, hasta fines del segundo ao, significan que cualquier mejora en nuestra eficacia de
contratacin tendr por resultado ahorros sustanciales para la firma.
Para comenzar a tratar el tema, Podras dar respuesta a las siguientes preguntas?
1. Necesitamos un resumen de la edad del personal al contratarse, del promedio de calificaciones de
grado y de la evaluacin del rendimiento en el segundo ao, para tener una apreciacin general del
grupo en adiestramiento financiero. Cul es el perfil de este personal?
2. Es ms alto el puntaje de varones en la nota de la prueba de aptitudes que el de mujeres? Y en la
evaluacin del rendimiento?

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 28 -

3. Un criterio inicial en RUBIOJA S.A era mantener la calificacin promedio de grado de los contratados
por encima de 14.00. Se sigue manteniendo este criterio?
4. Otro criterio era mantener por lo menos un tercio de los contratados que provengan de escuelas de
categora 2. Se sigue manteniendo este criterio?
5. Son diferentes los rendimientos en la prueba de entrada para las diferentes calidades de escuelas de
donde provienen los candidatos? Y en la Evaluacin del rendimiento del segundo ao?

Si Ud. fuera el analista que conclusiones le dara a Grecia Rubio respecto al anlisis que
realiz. Utilice la siguiente base de datos.
No.

Gnero

Edad

Calificacin

Calidad Universitaria

ndice-xito

Rendimiento 2

22

15,41

62

72

26

15,71

60

71

22

12,45

80

66

23

15,69

86

91

25

16,05

86

48

26

16,21

64

95

7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46

0
1
1
1
1
0
0
1
0
1
1
1
1
1
0
1
1
0
1
0
1
1
1
0
1
1
1
1
1
0
1
0
1
0
1
1
1
1
1
1

27
23
23
26
24
24
36
27
26
24
26
23
24
24
25
23
23
26
25
25
24
23
22
30
24
25
23
24
26
23
26
26
26
23
22
26
24
26
25
24

14,42
12,87
13,08
16,30
15,82
14,85
13,31
16,67
16,35
12,50
12,32
14,72
13,94
16,92
13,14
14,92
13,81
15,53
15,33
12,95
12,24
14,94
12,57
12,92
15,94
13,80
14,42
14,72
12,60
14,53
14,76
13,12
13,35
14,76
15,27
17,00
16,57
14,02
13,08
13,93

2
3
2
3
4
3
4
4
2
1
1
2
2
2
3
3
2
3
3
2
4
4
3
3
1
4
3
2
3
3
4
3
4
2
4
2
2
3
1
3

54
80
62
77
61
67
95
62
50
62
81
76
87
73
85
57
89
70
65
89
87
89
94
71
63
67
96
73
92
88
82
84
86
72
82
77
66
73
85
58

82
92
73
81
67
95
96
59
79
88
52
71
75
75
93
84
90
83
73
97
88
81
74
67
80
64
82
82
81
77
89
95
58
74
89
68
77
67
99
96

47

25

14,17

58

97

48
49

0
1

24
22

14,65
13,92

3
1

79
50

92
95

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 29 -

50
51

1
1

25
25

13,28
12,96

3
2

93
75

67
52

52

23

13,97

82

82

53
54
55

1
1
1

25
24
24

13,92
14,92
16,33

3
3
2

57
67
60

83
87
73

56
57

0
1

23
23

14,25
15,29

4
1

56
94

67
72

58
59

1
1

26
26

15,23
15,73

3
3

92
81

66
95

60
61

23

12,94

73

82

24

15,96

91

84

62

24

16,96

72

98

63

27

12,23

85

93

64

22

15,35

96

87

65

23

16,77

85

57

66

1
0

24
25

16,12
14,34

2
3

89
92

85
81

67
68

24

14,69

66

95

69

22

14,67

85

90

70

23

15,56

54

80

71

22

12,35

85

48

72

24

13,39

65

71

73

26

16,99

76

63

74

28

15,29

63

87

75

26

15,93

89

97

76

1
1

25
25

13,41
15,55

3
2

83
57

97
79

25

13,97

96

71

0
1

23
24

12,81
12,99

4
2

72
73

72
89

1
1

25
23

15,67
12,47

2
3

53
86

94
78

77
78
79
80
81
82
83

24

12,77

64

89

84

24

14,67

80

84

85

25

13,94

77

91

86

24

14,90

52

69

87

23

15,44

70

89

88

23

16,03

90

91

89

29

12,15

74

89

90

0
0
0
0
1

22
26
22
30
25

13,42
12,02
13,04
14,35
13,65

2
4
3
4
2

95
84
68
92
52

94
95
78
84
85

91
92
93
94
95

23

12,66

82

69

96

26

13,22

56

71

97

23

13,43

85

58

98

22

15,54

85

93

99

1
1

26
23

16,51
16,91

3
3

64
61

97
83

100

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 30 -

PARTE 4: ANLISIS DE CORRELACIN Y REGRESIN


1.

ANLISIS DE CORRELACIN
El anlisis de correlacin es una tcnica estadstica que mide el grado de asociacin o
afinidad entre las variables cuantitativas consideradas en un estudio.
Se llamar CORRELACIN SIMPLE cuando se trata de analizar la relacin entre dos
variables. Se llamar CORRELACIN LINEAL O RECTILNEA si la funcin es una recta, y
de CORRELACIN NO LINEAL cuando la funcin es una curva o una funcin de grado
superior.
El COEFICIENTE DE CORRELACIN DE PEARSON, es el estadgrafo que mide el grado
de asociacin o afinidad entre las variables cuantitativas y se denota por r la cual se
define como:
n

n X iYi X i Yi
i 1

i 1

i 1

i 1

n X i2 ( X i ) 2

Interpretacin:
-1
-0.7
Perfecta Alta

-0.4

Regular

Baja

Baja

i 1

i 1

i 1

n Yi 2 ( Y1 ) 2

0.4
Regular

NEGATIVA

2.

0.7
Alta

+1
Perfecta

POSITIVA

ANLISIS DE REGRESIN
2.1.

ANLISIS DE REGRESIN LINEAL SIMPLE


El anlisis de regresin es una tcnica estadstica que consiste en determinar la
relacin funcional entre dos variables cuantitativas en estudio.
Esta relacin funcional entre las variables, es una ecuacin matemtica de la forma
Y= A + B X, que recibe el nombre tambin de Funcin de Regresin o Modelo de
Regresin.
A la variable Y se le denomina variable dependiente, a la variable X independiente y a
las variables A, B se les denomina parmetros de la ecuacin de regresin.
La finalidad del Anlisis de Regresin es hacer pronsticos es decir, hacer
estimaciones futuros de la variable dependiente.
PASOS A SEGUIR:
a. Realizar el diagrama de dispersin y ver el comportamiento de la variable.
b. Aplicar el mtodo de los Mnimos Cuadrados Ordinarios para estimar los
parmetros de la ecuacin. Las frmulas son las siguientes:
n

n X i Yi
i 1

X Y
i 1
n

i 1

A Y BX

n X i2 ( X i ) 2
i 1

i 1

c. Para hacer el pronstico o el valor estimado de Y, reemplazar en la ecuacin


matemtica el respectivo valor de Xo, de la siguiente manera:
Y = A + B (Xo)

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 31 -

2.3.

REGRESIN LINEAL MLTIPLE


El ARLM es una tcnica estadstica que consiste en determinar el modelo de
regresin lineal mltiple de una variable respuesta (Y) y un conjunto de variables
independientes (Xs).
El modelo de regresin lineal mltiple est dado por la siguiente ecuacin:

Y 0 1 X 1 2 X 2 ... K X K
Para encontrar este modelo, es decir, estimar sus coeficientes tambin se utiliza el
Mtodo de los Mnimos Cuadrados Ordinarios.
Los elementos de este modelo de regresin mltiple son los siguientes:
Y es la variable dependiente o variable respuesta.
A las Xs se le llama variables independientes.
Bs se les llama coeficientes de regresin.
En el ARLM se prueban las siguientes Hiptesis:
Ho: Los Bs son iguales a cero (No hay efecto de las variables independientes en Y);
H1: Los Bs son diferentes de cero (Por lo menos un X influye en Y).
Para dar respuesta a esta Hiptesis se utiliza el anlisis de varianza.
2.4.

REGRESIN LINEAL CON EXCEL (MEGASTAT)


Para realizar estos ejercicios se deben realizar los siguientes pasos: Hacer clic en
Complementos / MegaStat / y aparece la siguiente ventana.

Luego aparece la ventana de dilogo donde hay que ingresar el rango de Y, el rango de
X, activar rtulos, las opciones de salida y algunas alternativas de inters para el
investigador.

Luego tomar las decisiones respectivas.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 32 -

APLICACIN 01
LA EMPRESA HIDRANDINA de la ciudad de Trujillo,
est haciendo un estudio sobre los consumos de energa
(en miles de kilowatts - hora) y el nmero de reas de
trabajo en un conjunto de Empresas Privadas. Para este
estudio se selecciona una muestra aleatoria de 10
Empresas Privadas, en la cual se obtuvo los siguientes
resultados: (ver cuadro)
Se solicita:
a. Estimar la ecuacin de regresin lineal.
b. Evaluar el consumo (en miles de kilowatts-hora), para
una Empresa que tiene 6 reas de trabajo.

N de casa

Nmero de
reas de
trabajo

1
2
3
4
5
6
7
8
9
10
Total

2
4
4
3
1
3
1
5
5
3

Consumo
de energa
(miles de
kw)
4
11
10
5
3
6
3
18
14
7

SALIDA DEL MEGASTAT:


Regression Analysis
r
0.857
r
0.926
Std. Error
2.021
ANOVA table
Source
SS
Regression
196.2333
Residual
32.6667
Total
228.9000
Regression output
variables
Intercept
Nmero de reas de
trabajo

n
k
Dep. Var.

10
1

df
1
8
9

MS
196.2333
4.0833

Consumo de energa (miles de kw)


F
48.06

coefficients
-1.8889

std. error
1.5763

t (df=8)
-1.198

p-value
.2651

3.2222

0.4648

6.932

.0001

p-value
.0001

confidence interval
95%
lower
95% upper
-5.5237
1.7460
2.1504

4.2941

APLICACIN 02:
N de
maquina
1
2
3
4
5
6

Tiempo de
antigedad
(aos)
1
1
2
2
3
3

Total

Costo de
mantenimiento.
($)
14
16
20
24
30
28

El Administrador General de Vencedores S.A. est haciendo un


estudio entre el gasto de mantenimiento de sus computadoras y
el ao de antigedad de dichas mquinas. Para esto recurre a la
oficina de Mantenimiento y Contabilidad obteniendo la siguiente
informacin: (ver cuadro)
Se solicita:
a. Estimar la ecuacin de regresin lineal.
b. Estimar cunto sera el costo de mantenimiento de una
computadora que tiene 7 aos.
c. Calcular e interpretar el valor del coeficiente de regresin lineal
r

APLICACIN 03:
El jefe de personal de una empresa comercializadora cree que existe
una relacin entre la tardanza al trabajo y la edad del trabajador. Con el
propsito de estudiar el problema tom en cuenta la edad de diez
trabajadores escogidos al azar y contabiliz los das de tardanza
durante todo un ao. Los resultados fueron como se observa en la
tabla que sigue:
Se solicita:
a. Construir el diagrama de dispersin.
b. Obtener la ecuacin de la recta de regresin.
c. Si un docente tiene 38 aos, averiguar Cuntas tardanzas se
espera que tenga al ao?
d. Si un trabajador tiene 3 tardanzas al ao, averiguar Qu edad se
puede esperar que tenga este trabajador?
e. Determinar el grado de relacin entre las variables en estudio.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

N
1
2
3
4
5
6
7
8
9
10
Total

Edad en
aos
25
50
35
20
45
50
30
40
62
40

N de Tardanza en
un ao
20
5
10
20
8
2
15
12
1
8

pg. - 33 -

PARTE 5: DISTRIBUCIONES DE PROBABILIDAD


1.

LA DISTRIBUCIN BINOMIAL

La Distribucin Binomial es una las distribuciones de probabilidad discretas ms


importantes, la cual tiene muchas aplicaciones en Ingeniera, Administracin, etc.
Esta distribucin se origina en los Ensayos o Experimentos Bernoulli que consiste en
realizar 1 experimento, con la obtencin de dos resultados posibles, llamados xito y
fracaso.
Ejemplos:
1. Lanzar una moneda.
2. Rendir un examen.
Ensayos de Bernoulli
3. Observar el sexo de un recin nacido.
4. Encender una mquina, etc.
Experimento Binomial:
Es aquel que consiste en realizar n veces ensayos de Bernoulli, en el cual se debe
cumplir lo siguiente:
a. Cada ensayo tienen solo dos resultados posibles.
b. Los ensayos son independientes.
c. La probabilidad de xito p es constante en cada ensayo.
Esta distribucin tienen las siguientes caractersticas:
1. Su variable aleatoria est definida como:
X: Nmero de xitos en n ensayos.
2. Su recorrido o rango es:
Rx = {0,1,2,3,4,5, , n}
3. Su funcin de probabilidad est dada por:

4. Sus parmetros son :


n: Nmero de veces que se repite el experimento o tamao de muestra.
p: Probabilidad de xito en cada uno de los ensayos o proporcin de inters.
5. Su notacin es : X
B ( n, p )
6. Uso de tabla: Para el uso de tabla tener en cuenta lo siguiente
A.
B.
C.
D.
E.
F.
G.

P
P
P
P
P
P
P

(
(
(
(
(
(
(

Xa
X>a
Xa
X=a
aX
aX
a<X

) = Usar directamente la tabla


)=1- P(Xa)
)=1- P(Xa-1)
)=P(Xa)-P(Xa-1)
b ) = P ( X b ) - P ( X a-1 )
< b ) = P ( X b-1 ) - P ( X a-1 )
< b ) = P ( X b-1 ) - P ( X a )

APLICACIN CON MEGASAT:


APLICACIN 01:
En el almacn de la Empresa MAESTROS, hay 12 artculos elctricos de los cules 3 de ellos son
defectuosos. Si se extrae una muestra aleatoria de 5 a partir del grupo. Cul es la probabilidad de que:
a. Exactamente 1 sea defectuoso.
b. Ninguno sea defectuoso.
c. Menos de 2 sean defectuosos.
d. Ms de 3 sean defectuosos.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 34 -

SOLUCIN:

Binomial distribution

X
0
1
2
3
4
5

5 n
0.25 p
cumulative
P(X) probability
0.23730
0.23730
0.39551
0.63281
0.26367
0.89648
0.08789
0.98438
0.01465
0.99902
0.00098
1.00000
1.00000
1.250 expected value
0.938 variance
0.968 standard deviation

Binomial distribution (n = 5, p = 0.25)

P(X)

0.60
0.40
0.20
0.00
0

APLICACIN 02:
En la Universidad Privada del Norte Escuela de Postgrado se est aplicando un nuevo mtodo de
enseanza del aprendizaje del Idioma Portugus. Despus de completar con la aplicacin de este mtodo
se evala que el 1% sali desaprobado. El director acadmico selecciona en forma aleatoria estudiantes
al azar de la Universidad:
a. Cul es la probabilidad de que exista ms de 3 desaprobados?
b. Cul es la probabilidad de que exista menos de 3 desaprobados?
c. Cul es la probabilidad de que haya entre 2 y 4 desaprobados inclusive?

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 35 -

APLICACIN 03:
Segn informacin de Secretara Acadmica de la UPN, el 65% de los estudiantes son de gnero
masculino y el resto del gnero femenino. Para la aplicacin de una encuesta por parte de la asistenta
social, se selecciona aleatoriamente a 10 estudiantes:
a. Cul es la probabilidad de encuestar a menos de 5 hombres?
b. Cul es la probabilidad de encuestar ms de 5 hombres?
c. Cul es la probabilidad de encuestar a 3 y 8 hombres inclusive?
d. Cul es la probabilidad de encuestar a ningn hombre?

2.

LA DISTRIBUCIN POISSON
La Distribucin de Poisson es otra de las distribuciones de probabilidad discretas ms
importantes porque se aplica en muchos problemas reales.
Esta distribucin se origina en problemas que consisten en observar la ocurrencia de
eventos discretos en un intervalo continuo (unidad de medida).
Ejemplos:
1. Nmero de manchas en un metro cuadrado de un esmaltado de un refrigerador.
2. Nmero de vehculos que llegan a una estacin de servicios durante una hora.
3. Nmero de llamadas telefnicas en un da.
4. Nmero de clientes que llegan a un banco durante las 10 y 12 p.m.
3
5. Nmero de bacterias en un cm de agua.
Esta distribucin tienen las siguientes caractersticas:
- Su variable aleatoria est definida como:
X: Nmero de ocurrencias en 1 unidad de medida (Tiempo, Volumen,
Superficie, etc)
- Su recorrido o rango es:
Rx = {0,1,2,3,4,5, .}
Su funcin de probabilidad est dada por:

Su parmetro es : tasa promedio de ocurrencia en 1 unidad de medida.


Su notacin es: X
P( )
Uso de tabla: Para el uso de tabla tener en cuenta lo siguiente
H.
I.
J.
K.
L.
M.
N.

P
P
P
P
P
P
P

(
(
(
(
(
(
(

Xa
X>a
Xa
X=a
aX
aX
a<X

) = Usar directamente la tabla


)=1- P(Xa)
)=1- P(Xa-1)
)=P(Xa)-P(Xa-1)
b ) = P ( X b ) - P ( X a-1 )
< b ) = P ( X b-1 ) - P ( X a-1 )
< b ) = P ( X b-1 ) - P ( X a )

APLICACIN CON MEGASTAT


APLICACIN 01
En un estudio de Satisfaccin del Cliente, se determin que las personas llegan aleatoriamente a la ventanilla de
caja, con una tasa promedio de 24 personas por hora, durante la hora punta comprendida entre 11:00 am y
12:00 am de cierto da. El jefe administrativo desea calcular las siguientes probabilidades:

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 36 -

a.
b.
c.
d.

Cul es la probabilidad de que lleguen exactamente 5 personas durante esa hora?


Cul es la probabilidad de que lleguen ms de 5 personas durante esa hora?
Cul es la probabilidad de que lleguen menos de 5 personas durante esa hora?
Cul es la probabilidad de que lleguen ms de 8 personas durante esa hora?

SOLUCIN:

Poisson distribution
24
X
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

P(X)
0.00000
0.00000
0.00000
0.00000
0.00000
0.00000
0.00001
0.00003
0.00010
0.00027
0.00066
0.00144
0.00288
0.00531
0.00911
0.01457
0.02186
0.03086
0.04115
0.05198
0.06238
0.07129
0.07777
0.08115
0.08115
0.07791
0.07191
0.06392
0.05479
0.04534
0.03628
0.90415
24.000
24.000
4.899

mean rate of occurrence


cumulative
probability
0.00000
0.00000
0.00000
0.00000
0.00000
0.00000
0.00001
0.00005
0.00015
0.00043
0.00108
0.00252
0.00540
0.01072
0.01983
0.03440
0.05626
0.08713
0.12828
0.18026
0.24264
0.31393
0.39170
0.47285
0.55400
0.63191
0.70382
0.76774
0.82253
0.86788
0.90415

expected value
variance
standard deviation

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 37 -

Poisson distribution ( = 24)


0.10

P(X)

0.08
0.06
0.04
0.02
0.00
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
X

APLICACIN 02
Si la secretaria de una Escuela de Postgrado, recibe un promedio de 2 llamadas cada 3 minutos por motivos
acadmicos. Calcular lo siguiente:
a. Cul es la probabilidad de que reciba ms de 3 llamadas en 3 minutos?
b. Cul es la probabilidad de que reciba menos de 2 llamadas en tres minutos?
c. Cul es la probabilidad de que reciba exactamente 2 llamadas en tres minutos?
d. Cul es la probabilidad de reciba 5 llamadas en 6 minutos?
e. Cul es la probabilidad de que reciba menos de 2 llamadas en un minuto?

APLICACIN 03
En un estudio por parte del Ministerio de Transporte y Comunicaciones (MTC), se ha determinado que en la
carretera panamericana con destino a Lima, hay en promedio 20 accidentes por semana (7 das), calcular las
siguientes probabilidades:
a. Cul es la probabilidad de que en una semana no haya ningn accidente?
b. Cul es la probabilidad de que en dos semanas haya 10 accidentes?
c. Cul es la probabilidad de que en 1semana ocurra menos de 15 accidentes?
d. Cul es la probabilidad de que en un da haya tres o menos accidentes?
e. Cul es la probabilidad de que en un da haya tres o ms accidentes?

APLICACIN 04
En el Centro de impresiones de la UPN se comete dos fallas en las impresiones debido a causas externas cada
vez que se imprimen 2,500 hojas como promedio. Con esta informacin determinar:
a. La probabilidad de que en una impresin de 500 hojas, ocurra uno ms errores.
b. La probabilidad de que no ocurrirn errores en una impresin de 50 hojas.

APLICACIN 05
Los clientes de una empresa llegan a la tienda de venta aleatoriamente, a una tasa de 300 personas por hora.
Calcular la probabilidad de que:
a. Una persona llegue durante un periodo de 1 minuto.
b. Por lo menos dos personas lleguen durante un periodo dado de un minuto.
c. Ninguna persona llegue durante un periodo de 1 minuto.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 38 -

3.

LA DISTRIBUCIN NORMAL

La distribucin normal, llamada tambin Curva de Gauss (en recuerdo al cientfico que la
descubri), es la distribucin de probabilidad ms importante en la Estadstica y por ende del
clculo de Probabilidades.
Esta distribucin de probabilidad es importante porque las variables aleatorias continuas
(peso, edad, talla, produccin, gasto en publicidad, temperatura, ventas, PBI, ganancias, etc.)
que son variables que ms se evalan en una investigacin cientfica o investigacin de
mercados se aproximan a esta distribucin de probabilidad.
Tambin es importante porque se utiliza como aproximacin de las distribuciones discretas
tales como: la Binomial, la Poisson, etc.

CARACTERSTICAS
1. Tiene como parmetros a y
2. Su funcin de probabilidad est dada por:

f ( x)

1 X

, X

Adems:
- < < +
y

>0

3. El promedio puede tomar valores entre y + mientras que > 0, entonces existen
infinitas curvas normales.
4. Esta funcin de probabilidad es asinttica con respecto al eje X, (a pesar de tener recorrido
infinito, la curva nunca toca el eje X); adems es unimodal y es simtrica con respecto a la
media .
5. El rea bajo esta funcin o curva es 1 100%, de la misma manera se sabe que las reas
comprendidas bajo la curva normal son:
1.

= 68.3%

2. 2 = 95.5%
3. 3 = 99%

2 1

5. Para calcular probabilidades en la distribucin normal se necesitarn infinitas tablas de


probabilidad.

4.

LA DISTRIBUCIN NORMAL ESTNDAR


1. Es una distribucin a la cual se le ha modificado la escala original; esta modificacin se ha
logrado restando la media al valor de la variable original y dividiendo este resultado por ,
la nueva variable se denota por Z y recibe el nombre de variable estandarizada

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 39 -

2. La modificacin de la escala ha permitido elaborar una tabla para el clculo de las


probabilidades; si esto no hubiera sido posible, sera necesario construir una tabla para
cada valor de y .
3. La funcin de densidad de la variable estandarizada es:
1

1
2

f ( z)

e2

4. El promedio (valor esperado) y la varianza de Z son: E(Z) = 0 , V(Z) = 1


5. Notacin:
2
Si X es v.a. continua distribuida normalmente con media y varianza , la denotamos por:
2
X N( , ).
Aplicando esta notacin a la variable normal estandarizada Z, escribimos:
Z N(0 , 1), esto se interpreta como, Z tiene distribucin normal con media 0 y varianza 1.
6. La superficie bajo la curva normal Z estandarizada tambin es igual a 1. Por consiguiente,
las probabilidades pueden representarse como reas bajo la curva normal estandarizada
entre dos valores.
7. Debido a que la distribucin normal es simtrica muchas de las tablas disponibles contienen
slo probabilidades para valores positivos de Z.

USO DE TABLA
Si se conoce el comportamiento de una variable, es decir, se sabe que tienen una distribucin
normal, para calcular las diferentes probabilidades se tiene que estandarizar la variable. Una vez
estandarizada la variable, recin utilizar la tabla de la distribucin normal estandarizada o tabla Z.
FRMULAS:
a.

b.

P( x a ) P(

) P( Z

P ( x a ) 1 P ( x a ) 1 P(

c. P(a x b) P( x b) P( x a) P(

5.

) 1 P( Z

) P(

APLICACIN CON MEGASTAT

APLICACIN 01:
El rendimiento acadmico de los estudiantes de una Universidad, tiene una distribucin normal con media igual a
15 y varianza igual a 4. Si se selecciona un estudiante de esta Universidad, encuentre la probabilidad de que:
a. El rendimiento sea menor que 16.
b. El rendimiento sea menor que 14.
c. El rendimiento este entre 14 y 18.
d. El rendimiento sea mayor 15.5.

SOLUCIN

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 40 -

Reemplazando valores:

APLICACIN 02:
Los salarios mensuales de los trabajadores administrativos tiene un comportamiento normal cuya media es S/.
2100 y una desviacin estndar de S/. 50. Cuntos trabajadores tienen salarios:
a. Menores de S/. 2150.
b. Menores de S/. 2200.
c. Mayores a S/. 2180.
d. Entre 2080 y 2150 soles.

APLICACIN 03:
El tiempo de duracin de los focos elctricos de los caones proyectores tienen una distribucin normal con una
media de 1000 horas y una desviacin estndar de 250 horas. Determinar la probabilidad de que:
a. Un foco tomado al azar se queme antes de las 990 horas de funcionamiento.
b. Un foco se queme entre 980 y 1120 horas de funcionamiento.
c. Un foco dure ms de 998 horas.

APLICACIN 04:
NEUMA Per, es una empresa que produce llantas para automviles en nuestro pas. La vida til de estas llantas
se distribuye aproximadamente como una normal con media y desviacin estndar iguales a 32000 y 1000 millas
respectivamente. Esta empresa quiere exportar estas llantas por lo que empieza a hacer ciertos clculos acerca
de la calidad de estas llantas, para lo cual se hace las siguientes preguntas:
a. Cul es la probabilidad de que una llanta producida por esta empresa tenga una vida til de 31900 millas?
b. Cul es la probabilidad de que una llanta producida por esta empresa tenga una vida til desde 31000 y
33000 millas?
c. Si la empresa fija una garanta de 30000 millas. Qu porcentaje de esta produccin necesitar ser
reemplazada?

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 41 -

PARTE 6: ESTIMACIN ESTADSTICA


ESTIMACIN: Es el proceso mediante el cual se intenta determinar el valor del parmetro de la
poblacin a partir de la informacin de una muestra. Al realizar una estimacin siempre se va a
cometer un error. Existen dos tipos de estimacin:
A. ESTIMACIN PUNTUAL
B. ESTIMACIN INTERVLICA

1.

ESTIMACION PUNTUAL
Es aquel nico valor que se obtiene de la muestra, es decir, que para su clculo se debe tener
informacin muestral. Las frmulas para calcular o realizar estas estimaciones son las siguientes:
PROMEDIO
PARMETRO

VARIANZA

PROPORCIN

ESTIMACIN
PUNTUAL

2.

x
i 1

s
2

(x
i 1

x )2

n 1

a
P p
n

ESTIMACIN INTERVLICA
Al realizar una estimacin, siempre se va a cometer un error. Entonces, cuando estimamos un
parmetro nunca va a ser exacto, ese valor ser mayor o menor al verdadero. Entonces se
obtendr un intervalo de valores posibles. Ese intervalo se llama estimacin intervlica. A esa
diferencia mayor o menor se llama error de estimacin, el cual est en relacin directa con la
variabilidad del estimador y el nivel de confianza determinado por el investigador. La estimacin
intervlica para un parmetro en general, est dada por:

Z / 2

Z / 2

Error de Estimacin

Error de estimacin

Tambin se puede escribir de la siguiente manera:

: Z / 2
Para determinar este intervalo se necesita de:
a. La estimacin puntual.
b. La desviacin estndar del estimador.
c. Nivel de confianza, el cual ser repartido para cada lado del intervalo.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 42 -

FRMULAS DE LOS INTERVALOS DE CONFIANZA


I. INTERVALO DE CONFIANZA PARA EL PROMEDIO POBLACIONAL
A. Si la muestra (n) es mayor de 30 y la varianza poblacional es conocida:

: x Z / 2

B. Si la muestra (n) es menor o igual a 30 y la varianza poblacional es desconocida:

: x t ( / 2, n 1)

s
n

II. INTERVALO DE CONFIANZA PARA LA PROPORCIN POBLACIONAL


A. Si la proporcin poblacional se conoce:

P : p Z / 2

PQ
n

B. Si la proporcin poblacional No se conoce: (entonces hay que calcularla en la muestra)

P : p Z / 2

pq
n

III. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS


A. Si las muestras son de tamao n1>30 y n2>30 (grandes) y adems las varianzas
poblacionales se CONOCEN:

1 2 : ( x1 x 2 ) Z / 2

12
n1

22
n2

B. Si las muestras son de tamao n1<30 y n2<30 (pequeas) y adems las varianzas
poblacionales DESCONOCIDAS:

1 2 : ( x1 x2 ) t( / 2, n n
1

2)

sc2 (

1 1
)
n1 n2

Donde:

(n 1 1)s 12 (n 2 1)s 22
sc
n1 n 2 2
2

, se llama varianza mancomunada

IV. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES:


A. Si p1 y p2 se determinan a partir de muestras:

P1 P2 : ( p1 p 2 ) Z / 2

p1 q1 p 2 q 2

n1
n2

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 43 -

3.

APLICACIN UTILIZANDO MEGASTAT

RESPECTO AL PROMEDIO:
APLICACIN 01:
Los estudiantes de Administracin de una Universidad realizaron un trabajo de aplicacin respecto a los sueldos
de los trabajadores de la mina YANACOCHA, para lo cual seleccionaron una muestra aleatoria de 24
2
trabajadores en la cual se determin que el sueldo promedio semanal es de $160 y una varianza de 10 dolares .
a. Calcular un intervalo de confianza para el sueldo promedio con el 90% de confianza.
b. Calcular un intervalo de confianza para el sueldo promedio con el 95% de confianza.

SOLUCIN:

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 44 -

APLICACIN 02:
La Gerencia de la empresa HAMILTON LIGH est interesado en conocer el contenido de nicotina promedio de
su marca de cigarrillos. Para lo cual selecciona una muestra de 14 cigarros obteniendo un promedio de 25
2
miligramos y una varianza de 16 miligramos .
a. Calcular un intervalo de confianza para el sueldo promedio con el 99% de confianza.
b. Calcular un intervalo de confianza para el sueldo promedio con el 95% de confianza.
c. Calcular un intervalo de confianza para el sueldo promedio con el 90% de confianza.

APLICACIN 03:
Nuestro amigo BRUNO se dedica al negocio de los AUTOS, el sospecha que su margen de beneficios mensual
promedio por auto vendido est por debajo del promedio nacional de S/. 700. Para evaluar su margen de
beneficio toma informacin (muestra) respecto a 8 meses cuya informacin es la siguiente:
MES
BENEFICIO

800

840

780

850

810

790

805

800

Promedio

Varianza

a. Calcular un intervalo de confianza para el margen de beneficio promedio con el 99% de confianza.
b. Calcular un intervalo de confianza para el margen de beneficio promedio con el 95% de confianza.
c. Calcular un intervalo de confianza para el margen de beneficio promedio con el 90% de confianza.

RESPECTO A LA PROPORCIN:
APLICACION 04:
Segn un vendedor de automviles, de todos los vehculos adquiridos por los docentes universitarios, en ms del
80% de los casos el color es elegido por la mujer. Para verificar esta hiptesis se toma una muestra de 400
parejas que han comprado autos nuevos durante el ltimo ao, hallndose que en 310 casos el color fue en
efecto elegido por la dama. Calcular:
a. El intervalo confidencial para la proporcin considerando el 99 % de confianza.
b. El intervalo confidencial para la proporcin considerando el 90% de confianza.

SOLUCIN

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 45 -

RESPECTO A LA DIFERENCIA DE PROMEDIOS:


1.

La SUNAT est haciendo auditora en ciertos grifos gasolineros. Selecciona en forma aleatoria 05 grifos de 2
empresas diferentes (Texaco y Repsol). Los ingresos en miles de soles semanales se presentan a
continuacin:
TEXACO
: 90 85 95 76 80
REPSOL
: 84 87 90 92 90
a. Estimar un intervalo de confianza para la diferencia de medias (DIFERENCIA DE LOS INGRESOS
PROMEDIOS) con el 90% de confianza.
b. Estimar un intervalo confidencial para la diferencia de medias (DIFERENCIA DE LOS INGRESOS
PROMEDIO) con el 99% de confianza.

RESPECTO A LA DIFRENCIA DE PROPORCIONES:


1.

Se toman muestras independientes para determinar el la proporcin de personas que esta a favor de un
impuesto al combustible. La primera muestra consiste en 100 personas que solamente trabajan en Trujillo y
la segunda muestra es de 100 personas del cercado de Trujillo. Se determina que 50 y 60 personas de las
respectivas muestras estn de acuerdo con el aumento.
a. Calcular un intervalo de confianza para la diferencia de proporciones considerando el 99% de
confianza.
b. Calcular un intervalo de confianza para la diferencia de proporciones considerando el 90% de
confianza.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 46 -

PARTE 7: DETERMINACIN DEL TAMAO DE MUESTRA


1.

MUESTREO

Es una TCNICA ESTADSTICA por la cual se realizan inferencias a la poblacin examinando solo
una parte de ella, sta parte recibe el nombre de MUESTRA, la cual debe ser estadsticamente
representativa y adecuada.
Ventajas:
Desventajas:
Costo reducido
Presencia del error de muestreo
Mayor rapidez y exactitud
Presencia de gran variabilidad de las observaciones.
Minimiza los costos.

2.

TCNICAS DE MUESTREO
Existen 2 tipos de tcnicas de muestreo:
A. TECNICAS PROBABILSTICAS:
B. TECNICAS NO PROBABILSTICAS
Muestreo aleatorio simple
El muestreo a criterio o juicio.
Muestreo aleatorio estratificado
El muestreo por cuotas.
Muestreo sistemtico
El muestreo por conveniencia.
Muestreo por conglomerados
etc.
Etc.

3.

DETERMINACIN DEL TAMAO DE MUESTRA

Para determinar el tamao, primero hay que identificar la variable a estudiar (cuantitativa o
cualitativa). Luego depende de cuatro factores o elementos que son los siguientes:

PARA UNA VARIABLE CUANTITATIVA


a. Un nivel de confianza: es adoptado por el investigador, el cual puede ser 90%, 95% o 99% y que
origina el valor de Z.
b. El error de estimacin (E): es fijado por el investigador
c. La desviacin estndar o varianza: son valores que se obtienen por estudios anteriores, por la
muestra piloto o por la distribucin de la poblacin.
d. El Tamao de la poblacin (N): generalmente no se conoce.

PARA UNA VARIABLE CUALITATIVA


a. Un nivel de confianza: es adoptado por el investigador, el cual puede ser 90%, 95% o 99% y que
origina el valor de Z.
b. El error de estimacin (E): tambin es fijado por el investigador
c. La proporcin poblacional (P): son valores que se obtienen por estudios anteriores, por la muestra
piloto y si no se conoce asumir p=0.5.
d. El Tamao de la poblacin (N): generalmente no se conoce.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 47 -

5.

FRMULAS PARA DETERMINAR EL TAMAO DE MUESTRA

VARIABLE

Cualitativa
(Proporcin Poblacional)

Cuantitativa
(Promedio Poblacional)

POBLACIN
INFINITA
(Cuando no se
conoce N)

Z 2 P(1 P)
n0
E2

Z 2S 2
n0
E2

Z 2 P(1 P) N
n 2
E ( N 1) Z 2 P(1 P)

Z 2S 2 N
n 2
E ( N 1) Z 2 S 2

POBLACIN
FINITA
(Cuando se
conoce N)

Z= es el valor de la distribucin normal estandarizada para un nivel de confianza fijado por el investigador.
S= Desviacin estndar de la variable fundamental del estudio o de inters para el investigador. Obtenida por estudios
anteriores, muestra piloto, criterio de experto o distribucin de la variable de inters.
P= es la proporcin de la poblacin que cumple con la caracterstica de inters.
E= % del estimador o en valor absoluto (unidades). Fijada por el investigador.
N= Tamao de la poblacin.

6.

PASOS A SEGUIR PARA DETERMINAR LA MUESTRA PTIMA


A. Identificar el tipo de variable a analizar.
B. Asumir que la poblacin es infinita y aplicar la frmula respectiva sealada anteriormente.
Esta muestra se denomina muestra previa.
C. Luego si se conoce el tamao de la poblacin N, obtener la fraccin de muestreo

n0
N

n0
5% , entonces la muestra definitiva es n0 (muestra previa)
N
n
Si 0 5% , entonces se ajusta la muestra.
N
Si

D. Para ajustar la muestra se tiene que aplicar la siguiente frmula:

n0
n
1 0
N

, n es la muestra final.

ESTIMACIN DE LOS VALORES A APLICAR EN LAS FRMULAS


A. Valor de Z: es el valor de la abscisa de la distribucin normal estandarizada teniendo en
cuenta el nivel de confianza fijado por el investigador, por lo tanto este valor se encuentra en
las tablas estadsticas respectivas. Para hacer el trabajo menos tedioso, presentamos a
continuacin los diferentes valores de Z

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 48 -

TABLA N 01
VALORES DE LA DISTRIBUCIN NORMAL
ESTANDARIZADA(Z)
Valor Z

Nivel de confianza
(1-)

Nivel de significancia
()

Bilateral

Unilateral

90% = 0.90
95% = 0.95
98% = 0.98
99% = 0.99

10% = 0.10
5% = 0.05
2% = 0.02
1% = 0.01

1.64
1.96
2.32
2.57

1.28
1.64
2.05
2.32

B. Clculo del Valor de P: Se calcula este valor cuando la variable de estudio es cualitativa.
TABLA N 02
P
0.05
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
0.95

COMPORTAMIENTO DE P y Q
Q=1-P
0.95
0.90
0.80
0.70
0.60
0.50
0.40
0.30
0.20
0.10
0.05

PQ
0.0475
0.090
0.160
0.210
0.240
0.250
0.240
0.210
0.160
0.090
0.0475

C. Clculo del valor de la varianza (Si la variable es CUANTITATIVA): este valor es obtenida
por estudios anteriores, muestra piloto, criterio de experto o distribucin de la variable de
inters.
D. Clculo del error de estimacin: generalmente se asume 2%, 5%, y 8% de error. Este valor
es fijado por el investigador. Es la diferencia entre el parmetro (poblacin) y el estimador
(muestra). Es decir: E o o .Este error puede ser absoluto o relativo. Si E=0.35 se
denomina error absoluto. Si consideramos un error del 10% de la media, es decir, E=10%
( x )= 0.10 (3.5)=0.35 se denomina error relativo.

7.

APLICACIN UTILIZANDO MEGASTAT

APLICACIN 01
Cul ser el tamao de corridas de produccin adecuado si se requiere estimar el tiempo promedio para
efectuar la produccin de un producto qumico con una confianza del 95%? Adems en un estudio piloto se
encontr x 3.5 horas y s = 2.2 horas y adems el investigador asume E = 0.35 horas.

APLICANDO MEGASTAT

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 49 -

APLICACIN 02
El Director de la seccin de control de la rabia del Dpto. de salud pblica de la ciudad de Chiclayo desea obtener
una muestra de los registros de dicho Dpto. acerca de las mordidas de perro reportadas durante el ao anterior,
para estimar la edad media de las personas mordidas. El director desea una seguridad del 95%, con un E=2.5 y
en base a estudios anteriores conoce que la desviacin estndar es de 15 aos. De qu tamao debe ser la
muestra?

APLICACIN 03
Se desea estimar el tiempo medio de duracin de artefactos elctricos (focos) producidos por la empresa
PHILIPS. Se sabe por un estudio piloto de 10 focos que la desviacin estndar del tiempo de duracin es de 20
meses. De qu tamao debe ser la muestra para estimar el tiempo medio de duracin con un error mximo de
4 meses y con una confianza del 95%?

APLICACIN 04
Por estudios cientficos se sabe que el Coeficiente de Inteligencia promedio para jvenes segn la escala de
Weshler es de 100 puntos con una desviacin estndar de 15 puntos. Determinar el tamao de muestra para
realizar una investigacin sobre niveles de inteligencia en la UPN, si se admite un error del 2% del promedio y
una seguridad del 95%.

APLICACIN 05
Se desea estimar la proporcin de jvenes de la ciudad de CHICLAYO que hacen uso de Internet como mnimo
una hora diaria con un 95% de confianza. De estudios anteriores se conoce que P=0.70 y se desea un E = 5%.
Cul debe ser el tamao de muestra?

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 50 -

PARTE 8: PRUEBA DE HIPTESIS


1.

DEFINICIONES PRELIMINARES
a. HIPTESIS: es una respuesta a priori a un problema.
b. HIPTESIS ESTADSTICA: en un enunciado acerca del valor de un parmetro
poblacional.
c. PRUEBA DE HIPOTESIS: es un procedimiento basado en la informacin muestral y en la
teora de probabilidad, para determinar si una hiptesis estadstica debe ser aceptada o
rechazada.

2.

CLASES DE HIPTESIS
2.1.

HIPTESIS NULA.
Se denota por Ho.
Es una afirmacin o enunciado tentativo que se realiza acerca del valor de un
parmetro poblacional.
Por lo comn es una afirmacin acerca del parmetro de poblacin cuando toma un
valor especfico.

2.2. HIPTESIS ALTERNATIVA.


Se denota por H1.
Es una afirmacin o enunciado contraria a la presentada en la hiptesis nula.
3.

ERRORES QUE SE COMETEN EN UNA PRUEBA DE HIPTESIS:


Error Tipo I:

Se comete este error cuando se rechaza la hiptesis nula, cuando es verdadera.


Se denota por = P(Rechazar Ho/Ho es verdadera)
Error Tipo II:

Se comete este error cuando se acepta la hiptesis, cuando es falsa.


Se denota por = P(Aceptar Ho/Ho es falsa)
Decisin posible
Aceptar Ho
Rechazar Ho

Ho verdadera

Ho falsa

Decisin correcta

Error tipo II

Error tipo I

Decisin correcta

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 51 -

5.

TIPOS DE PRUEBAS DE HIPTESIS:


A. PRUEBA BILATERAL O PRUEBA DE DOS COLAS

/2

Ho: = 0
H1: 0

/2

B. PRUEBA UNILATERAL O PRUEBA DE UNA SOLA COLA:

Prueba de cola inferior o izquierda


Ho: = 0
H1: < 0

Prueba de cola superior o derecha

Ho: = 0
H1: > 0

6.

ETAPAS DE UNA PRUEBA DE HIPTESIS:

MTODO TRADICIONAL
1.
2.
3.

4.

5.
6.

Plantear la hiptesis nula y alternativa. (Ho y H1)


Especificar el nivel de significancia (generalmente la plantea el
investigador). ( =0.05, 0.01)
Calcular un valor experimental: Estadstico de prueba que debe
ser especificado en trminos de un estimador del parmetro a
probar.
Calcular el valor crtico: valor que se encuentra en la tabla de
probabilidades, que representa el valor que determinar la
regin de aceptacin y rechazo.
Tomar la decisin de aceptar o rechazar Ho.
Dar conclusin respectiva.

MTODO MODERNO
1.
2.

Plantear la hiptesis nula y alternativa. (Ho y H1)


Observar el valor p (significancia)
Si p< 0.05 RECHAZAR Ho
Si p 0.05 ACEPTAR Ho

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 52 -

8.

FRMULAS DE ALGUNOS ESTADSTICOS DE PRUEBA

FRMULAS DE LOS ESTADSTICOS DE PRUEBA


I. PRUEBA DE HIPTESIS PARA EL PROMEDIO POBLACIONAL:
A. Si n es mayor de 30 y la varianza poblacional es conocida:
Estadstico de prueba:

Z t Z / 2

(distribucin normal)

n
B.

Si n es menor o igual a 30 y la varianza poblacional es desconocida:


Estadstico de prueba:

x
s
n

t t t ( / 2, n 1)

(distribucin t de student)

II. PRUEBA DE HIPTESS PARA LA PROPORCIN POBLACIONAL


Estadstico de prueba:

pP
PQ
n

Z t Z / 2

Esta frmula es tanto para muestras grandes como para muestras pequeas.
III. PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE MEDIAS
C. Si las muestras son de tamao n1>30 y n2>30 (grandes) y adems las varianzas poblacionales se
CONOCEN:
Estadstico de prueba:

( x1 x 2 ) D

1
n1

D.

Z t Z / 2

2
n2

Si las muestras son de tamao n1<30 y n2<30 (pequeas) y adems las varianzas poblacionales
DESCONOCIDAS:

( x1 x 2 ) D
Sc

t t t ( / 2, n 1)

1
1

n1
n2

(distribucin t de student)

Donde :

(n 1 1)s 12 (n 2 1)s 22
sc
n1 n 2 2
2

, se llama varianza mancomunada

IV. PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE PROPORCIONES:


C. Si p1 y p2 se determinan a partir de muestras:

( p1 p 2 ) D
p1 q1 p 2 q 2

n1
n2

Z t Z / 2

Esta frmula es tanto para muestras grandes como para muestras pequeas.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 53 -

9.

PRUEBA DE HIPTESIS CON MEGASTAT

PRUEBA DE HIPTESIS PARA LA MEDIA

PRUEBA DE HIPTESIS PARA LA PROPORCIN

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 54 -

PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES

PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES

PRUEBA Z PARA COMPARAR PROPORCIONES

10. APLICACIN UTILIZANDO MEGASTAT


APLICACIN 01:
Las ganancias en miles de dlares de 10 centros educativos de nuestro medio han producido la siguiente
informacin:
15.8, 12.7, 13.2 16.9, 10.6, 18.8, 11.1, 14.3, 17.0 y 12.5.
Otro conjunto de centros educativos fueron evaluados tambin respecto a sus ganancias en miles dlares,
obteniendo los siguientes resultados:
24.9, 23.6, 19.8, 22.1, 20.4, 21.6, 21.8 y 22.5

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 55 -

Realizar una prueba de hiptesis para verificar si las ganancias de este ltimo grupo son superiores a
las ganancias de las empresas de nuestro medio. Para probar esta hiptesis utilice un = 0.05.
SOLUCIN: (Aqu se utiliza la prueba T para muestras independientes)

Hypothesis Test: Independent Groups (t-test, pooled variance)


T1
14.290
2.738
10

T2
22.088 mean
1.637 std. dev.
8 n
16
-7.7975
5.3911
2.3219
1.1014
0
-7.08
2.61E-06

df
difference (T1 - T2)
pooled variance
pooled std. dev.
standard error of difference
hypothesized difference
t
p-value (two-tailed)

APLICACIN 02
Jorge Melndez, Administrador del BCP, est interesado en saber si existe diferencia significativa entre los
tiempos de atencin al cliente de los mismos empleados que trabajan en los dos turnos: maana y tarde. Al
respecto, ayer personalmente registr los tiempos que utilizaron los empleados para atender a sus clientes en
ambos turnos. Los tiempos en minutos que registr fueron los siguientes:
Maana
2.10
4.10
4.70
3.70
6.00
3.90
Tarde
4.00
4.50
3.70
4.00
4.10
3.45
A la luz de estos resultados, a qu conclusin lleg Jorge Melndez? Utilice un nivel de confianza del 95%.

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 56 -

SOLUCIN: (Aqu se utiliza la prueba T para muestras pareadas)

Hypothesis Test: Paired Observations


0.00000 hypothesized value
4.08333 mean Maana
3.95833 mean Tarde
0.12500
1.30987
0.53475
6
5

mean difference (Maana - Tarde)


std. dev.
std. error
n
df

0.23 t
.8244 p-value (two-tailed)

APLICACIN 03
Un fabricante de microcircuitos est interesado en determinar si dos diseos diferentes producen un flujo de
electricidad equivalente. El ingeniero responsable ha obtenido la siguiente informacin:
Diseo 1
20.3
22.5
23.3
29.1
26.5
22.1
20.8
28.6
23.3
21.5
Diseo 2

23.5

26.5

23.6

21.5

26.4

27.9

22.5

25.5

26.7

23.9

Diseo 3

29.1

26.5

22.1

25.6

23.5

26.5

25.5

26.7

20.3

22.5

Diseo 4

20.3

22.5

25.5

26.7

28.9

17.3

21.5

20.4

27.9

26.5

Con =0.01, se desea determinar si existe alguna diferencia significativa en el flujo de electricidad entre los dos
diseos.

SOLUCIN: (Aqu se utiliza anlisis de varianza)

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 57 -

One factor ANOVA


Mean

23.80

10

Std. Dev
3.163 Diseo 1

24.80

10

2.089 Diseo 2

24.83

10

2.657 Diseo 3

23.75

10

3.865 Diseo 4

24.30

40

2.944 Total

SS

df

MS

p-value

0.40

0.7558

ANOVA table
Source
Treatment

10.833

3.6110

Error

327.266

36

9.0907

Total

338.099

39

Comparison of Groups
30.00
25.00
20.00
15.00
Diseo 1

Diseo 2

Diseo 3

Diseo 4

APLICACIN 04
Una compaa desea estudiar el efecto que tiene la pausa para el caf, sobre la productividad de sus obreros.
Selecciona 6 obreros y mide su productividad en un da cualquiera (sin pausa para el caf), y luego mide la
productividad de los mismos 6 obreros en un da que se concede la pausa para el caf. Las cifras que miden la
productividad son las que siguen: Con = 0,05. A qu conclusin llegar la compaa?.
TRABAJADOR
1
2
3
4
5
6
Sin pausa

23

35

29

33

43

32

Con pausa

28

38

29

37

42

30

APLICACIN 05
En fecha reciente fue descubierto un neurotransmisor cerebral endgeno llamado galanina. Segn parece, ste
afecta de manera directa el deseo de ingerir alimentos con un alto contenido de grasa. Mientras ms alta sea la
cantidad de este neurotransmisor de origen natural en un individuo, mayor ser el apetito que este sienta por la
comida con alto contenido de grasa. Recientemente una compaa farmacutica desarroll una sustancia
experimental que bloquea la galanina sin alterar el apetito por otros alimentos ms saludables (es decir con
menos grasas). Un neurocientfico piensa que esa sustancia experimental ser muy til para controlar la
obesidad. Se realiza un experimento para lo cual se elige 10 mujeres obesas todas ellas voluntarias y se les
administra el medicamento experimental durante 06 meses. Se registra el peso inicial y el peso final (despus de
6 meses) de cada persona. Los pesos se presentan en la siguiente tabla. Probar si el uso del medicamento
experimental produce prdida de peso en las personas. Utilice un nivel de significancia de 0.05.
Persona
PESO INCIAL (libras)
PESO FINAL (libras)
1
165
145
2
143
137
3
175
170
4
135
136
5
148
141
6
155
138
7
158
137
8
140
125
9
172
161
10
164
156

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 58 -

REFERENCIAS BIBLIOGRFICAS

MOYA, R. (1991). Estadstica descriptiva. Editorial San Marcos. Lima-Per.


ARON A, ARON E. (2001). Estadstica para psicologa. Editorial Prentice Hall y Pearson Educacin.
Buenos Aires.
KERLINGER, F.; LEE, H. (2002).
Hill/Latinoamericana. Mxico 2002.

Investigacin

del

comportamiento.

Editorial

McGraw-

OTINIANO, C. (2007). Gua metodolgica de la estadstica descriptiva e inferencia. Editorial San


Marcos. Primera edicin. Lima-Per.
SANTOS, J. (2009). Diseo de encuestas para estudios de mercado. Tcnicas de muestreo y anlisis
multivariante. Editorial Centro de Estudios Ramn Areces S.A.
HERNANDEZ, R. (2006). Metodologa de la investigacin. Editorial Mc Graw Hill. Cuarta Edicin.
Mxico.
PGINAS WEBS:
http://www.fisterra.com/mbe/investiga/10descriptiva/10descriptiva.htm
http://www.fisterra.com/mbe/investiga/10descriptiva/10descriptiva2.pdf

SISTEMA DE GESTIN DE LA INVESTIGACIN UPN

pg. - 59 -

You might also like