You are on page 1of 180

Apuntes

De
Estadstica
Prof: Natalia Henrquez
CONTENIDOS
I. Estadstica Descriptiva.
II. Distribuciones conjuntas y marginales.
III. Medidas de asociacin.
IV. Probabilidades.
V. Variables aleatorias.
VI. Distribucin Normal.
VII. Intervalos de confianza.
VIII. Dcima de Hiptesis.
IX. Test de bondad de ajuste.
X. Regresin lineal.
BIBLIOGRAFA
Introduccin a las probabilidades y aplicaciones estadsticas
Meyer.Paul ( Addison-Wesley).
Teora y problemas de probabilidad y estadstica. Serie Schaum.
Probabilidad y Estadstica para ingeniera y ciencias. Gabriel Velasco Sotomayor ,
Piotri Marian Wisniewski.
Prof: Natalia Henrquez 2
Prof: Natalia Henrquez
I. ESTADSTICA DESCRIPTIVA
Objetivo: Reconocer los conceptos bsicos de la Estadstica Descriptiva.
1.
Resea Histrica.

Qu es Estadstica?, etimolgicamente el vocablo deriva de Estado y
significa "contar los bienes del Estado", los albores de esta disciplina se
encuentran en la Antigedad, las autoridades del Egipto faranico contaban
sus bienes y registraban la profundidad del ro Nilo en cada estacin del ao,
recurdese tambin que Jesucristo nace en Beln, porque un edicto del
emperador romano ordena un censo, para conocer el nmero y caractersticas
de los habitantes del Imperio, as las personas deban reportarse a sus lugares
de nacimiento y San Jos es nacido en Beln de Jud.
Sin embargo la disciplina, desde aquellos lejanos tiempos hasta nuestros
das ha ampliado su quehacer, perfeccionado tanto sus mtodos, que hoy es la
disciplina mas usada por el resto de las Ciencias, lo que ha conllevado su
vertiginoso desarrollo, sobretodo en el siglo XX.
As, hoy decimos que la Estadstica es la disciplina que se ocupa de:
1) la recoleccin, organizacin y procesamiento de datos, y
2) la obtencin de inferencias a partir de un volumen de datos cuando se
observa slo una parte.
1.1.- Mtodo Cientfico y Estadstico.
El hombre busca en forma inclaudicable una explicacin racional a los
fenmenos que lo rodean. El Mtodo Cientfico le ayuda a organizar
adecuadamente la observacin de los hechos y a enunciar las leyes que los
rigen. En la gran mayora de los casos reales el enunciado de las leyes se
complica porque el fenmeno estudiado tiene una multicausalidad y esta
contingencia se trata de superar con el Mtodo Estadstico.
Prof: Natalia Henrquez 3
Prof: Natalia Henrquez
Mtodo Cientfico es un procedimiento que se aplica al ciclo completo
de la investigacin, desde el enunciado del problema hasta la evaluacin de los
resultados obtenidos. Al aplicar el Mtodo Cientfico se distinguen las
siguientes etapas:
1) Deteccin y Enunciado del Problema: Es la descripcin de una
situacin problema o es el planteamiento de una pregunta.
2) Formulacin de la Hiptesis: Es una respuesta o explicacin al
problema enunciado, que se hace en base al conocimiento cientfico
existente.
3) Deduccin de una consecuencia verificable: Como la hiptesis es una
explicacin general, a menudo ocurre que no se puede investigar
directamente, luego se procede a deducir, lgicamente,
consecuencias particulares de la hiptesis.
4) Verificacin de la consecuencia: En ciencias exactas esto se realiza
usando lgica pura, sin embargo en ciencias no exactas la
verificacin se hace a travs de la recoleccin de informacin o la
observacin de los fenmenos, lo que hace necesario la aplicacin de
Procedimientos Estadsticos.
5) Conclusin: Consiste en la aceptacin, modificacin o total rechazo
de la hiptesis planteada.
Mtodo Estadstico es el que proporciona las tcnicas necesarias para
Recolectar y Analizar la informacin requerida. El Mtodo Estadstico distingue
dos etapas: la Planificacin y la Ejecucin.
En la Planificacin se deben considerar los siguientes aspectos:
1) Definicin de objetivos: es la descripcin formal del problema que da
origen a la investigacin. Se debe sealar detalladamente lo que se
va a investigar, el qu, cmo, dnde, cundo y por qu.
2) Universo del estudio: es la definicin del conjunto desde el cual se
extraer la informacin y hacia el que se generalizarn las
conclusiones obtenidas.
3) Diseo de la muestra: la Teora de Muestreo garantiza que la
informacin que generaremos nos permita proyectar vlidamente las
conclusiones al Universo de inters.
Prof: Natalia Henrquez 4
Prof: Natalia Henrquez
4) Definicin de las unidades de observacin (que objetos
observaremos), las escalas de clasificacin y las unidades de medida.
5) Preparacin del Plan de Tabulacin y Anlisis de la informacin: aqu
se determinan las formas de presentar y analizar la informacin
recolectada.
En la fase de Ejecucin se pueden reconocer los siguientes aspectos:
1) Recoleccin de la informacin.
2) Elaboracin de la informacin.
3) Anlisis de los resultados.
1.2.- Unidad de anlisis, atributos, variables, escalas de medida,
poblacin y muestra.
Unidad de anlisis: Una vez definido el problema que se va a
investigar, se definen naturalmente los objetos que sern observados (botellas
de cerveza, seres humanos, automviles, etc.), los que llamaremos en lenguaje
tcnico unidades de anlisis.
Atributos: Teniendo definidas las unidades de anlisis, obviamente
ellas presentan caractersticas que nos importan para nuestro estudio: Por
ejemplo, si es de nuestro inters analizar las distintas Cervezas que se venden
en nuestro pas, podemos consignar algunas caractersticas esenciales tales
como:
- Marca
- Tipo de envase
- Volumen del envase
- Grado alcohlico
- Color
- Sabor, etc...
Estas caractersticas las denominaremos atributos.
Prof: Natalia Henrquez 5
Prof: Natalia Henrquez
Variables: Cuando se han definido los atributos a estudiar, podemos ya
observar unidades de anlisis especificadas y los atributos quedan consignados
como caractersticas nicas del objeto que estamos estudiando. Por ejemplo si
observamos un envase individual especfico de Cerveza podemos consignar:
- Marca : Cristal
- Tipo de envase : Lata
- Volumen del envase : 258 cc.
- Grado alcohlico : 4,7
- Color : Amarillo medio
- Sabor : Amargo moderado
Cuando los atributos ya han sido evaluados, reciben el nombre de Variables del
estudio.
Escalas de medida: Cuando procedemos a medir las variables del
estudio, debemos tener presente que estamos consignando valores con
unidades de medida y por consiguiente introduciendo unidades de medida.
Estas escalas de medidas pueden ser: Nominales, Ordinales o Intervalares (o
de Razn). Estas escalas tienen diferente Poder de Clasificacin. Presentemos
el siguiente esquema:
Escala de Medida Poder de Clasificacin
Nominal Slo es capaz de nombrar o etiquetar
la unidad de anlisis. Por ejemplo:
Marca de Cerveza, Tipo de envase,
Color...
Ordinal Es capaz de nombrar pero adems
introduce una jerarqua en las
unidades observadas. Por ejemplo:
Grado que se cursa en el sistema
escolar bsico, Predileccin por la
Cerveza....
Intervalar Es capaz de nombrar, jerarquizar pero
adems permite hacer comparaciones
matemticas entre las unidades de
Prof: Natalia Henrquez 6
Prof: Natalia Henrquez
anlisis. Por ejemplo: Grado Alcohlico,
la Edad, el Peso, la Temperatura
Estas escalas de medida son inherentes a la variable que se mide.
Puntualicemos en las variables de escala intervalar, pues debido a su
naturaleza numrica estas se pueden clasificar en variables Discretas o
Continuas. Las variables discretas, formalmente estn relacionadas con los
nmeros Naturales (0,1,2,3,....) es decir, su funcin es Contar, como ejemplo
tenemos: Cantidad de Hijos, Cantidad de caries, Das trabajados etc. Las
variables continuas, formalmente estn relacionadas con los nmeros Reales,
su funcin es medir, en el sentido fsico, como ejemplo tenemos: la Masa, la
longitud, el Tiempo, etc...
Una importante observacin es que una variable inherentemente
continua, por razones operativas se discretiza, esto es: si a Ud. le preguntan
por su Edad, su respuesta estar en Aos Cumplidos (30 aos, 23 aos,..), sin
embargo la Edad de una persona es una variable que indica tiempo de vida, si
se quisiera ser exacto se tendra que contestar 30.213 aos (30 aos con 2
meses, 16 das, 16 horas y 19 minutos) lo que parece impracticable. La
precisin con que se mide una variable va de acuerdo al inters de la
investigacin, como se seal en el prrafo de Mtodo Estadstico.
Poblacin: Llamamos Poblacin al Conjunto Universo de las unidades
de anlisis, la poblacin puede ser de tamao finito o infinito. Por ejemplo, si se
desea averiguar el tamao del grano de cebada, la poblacin en estudio son
Todos los granos de cebada que existen en la tierra, esta poblacin en la
prctica es infinita. Si se desea analizar el volumen de cerveza en las botellas
diseadas para un litro producidas el da de ayer, la poblacin es finita.
Muestra: Como se puede apreciar, en muchos casos trabajar con una
poblacin completa puede resultar muy costoso o simplemente impracticable,
de aqu la necesidad de tomar una Muestra de la Poblacin, formalmente una
muestra es un SUBCONJUNTO FINITO de la Poblacin, que debe cumplir
caractersticas ineludibles para lograr que las conclusiones estadsticas sean
vlidas, as las caractersticas de una "buena muestra" son:
Prof: Natalia Henrquez 7
Prof: Natalia Henrquez
1) Aleatoria: garantiza que los elementos que componen la muestra
fueron escogidos completamente al azar, es decir no hay
predileccin alguna por incluir o excluir determinada unidad de
anlisis.
2) El tamao de la muestra, que es el nmero de unidades de anlisis
que se deben escoger, debe ser lo suficientemente grande como
para garantizar la generalidad de los resultados.
La determinacin del tamao de una muestra no es un problema trivial y
constituye una especializacin de la estadstica llamada Teora de Muestreo.
Con todo, los resultados comienzan a ser aceptables para muestras cuyo
tamao sea superior a 30.
2. Estadstica Descriptiva
Se llama estadstica descriptiva, al conjunto de tcnicas que permiten
ordenar, resumir y representar la informacin recolectada, como su nombre lo
indica, slo pretende hacer una descripcin cuantitativa del fenmeno sin
proyectar, an, sus resultados a la universalidad del fenmeno.
2.1.- Recoleccin, ordenacin y representacin de datos: Obtenida la
informacin que se desea analizar es necesario: Ordenarla, para ello
utilizaremos tcnicas que dependen de la naturaleza de la variable y su escala
de medida ; Representarla en tablas y/o grficos que nos permitan una primera
impresin de la muestra en anlisis, tambin los grficos y tablas se adecuan
a la naturaleza de la variable y su escala de medida. El detalle de este tema lo
trataremos a continuacin con ejemplos prcticos:
2.2.- Datos en escalas nominales y ordinales, tablas de frecuencia,
grfico de barras y circular.
Consideremos la siguiente situacin: Para saber la apreciacin que
tienen los bebedores de cerveza a cerca de los productos "Cerveza Nieve" y
Prof: Natalia Henrquez 8
Prof: Natalia Henrquez
"Cerveza Tostada"; se seleccionan 50 personas bebedoras de cerveza, cada
persona dir que tipo de cerveza prefiri y que tan amarga sabe la cerveza.
Para ello se tienen las siguientes codificaciones de las variables :
Tipo de Cerveza: 0 = Cerveza Nieve y 1 = Cerveza Tostada
Grado de Amargo: 0 = Amargo leve; 1 = Amargo moderado y 2 = Muy
amargo.
Notemos que la variable Tipo de Cerveza est medida en escala NOMINAL y el
Grado de Amargo en escala ORDINAL. Los datos recogidos se muestran a
continuacin:
Persona Tipo de
Cerveza
Grado de Amargo Persona Tipo de
Cerveza
Grado de Amargo
1 1 1 26 1 0
2 1 0 27 1 2
3 0 1 28 0 0
4 1 2 29 0 2
5 1 1 30 1 0
6 1 0 31 1 2
7 0 1 32 1 0
8 1 1 33 1 2
9 1 1 34 0 2
10 1 2 35 1 2
11 1 1 36 1 1
12 1 0 37 0 2
13 0 1 38 0 1
14 1 1 39 0 1
15 1 2 40 0 2
16 1 1 41 0 2
17 0 1 42 1 1
18 0 1 43 1 2
19 0 0 44 1 0
20 1 0 45 1 2
21 0 0 46 1 2
22 1 1 47 0 0
23 1 1 48 1 2
24 0 1 49 1 2
Prof: Natalia Henrquez 9
Prof: Natalia Henrquez
25 1 2 50 1 0
Al tabular el TIPO DE CERVEZA, es decir contabilizar las preferencias de
cerveza del TIPO 1 y del TIPO 2 vaciando el resultado en una tabla se obtiene:
Tipo | Freq. Percent Cum.
------------+-----------------------------------
0 | 17 34.00 34.00
1 | 33 66.00 100.00
------------+-----------------------------------
Total | 50 100.00
La informacin que contiene es la siguiente: 17 personas o bien el 34%
de las personas encuestadas prefieren cerveza TIPO 1 y el resto, o sea 33
personas o bien el 66% prefieren cerveza TIPO 2. Los nmeros en negritas no
tienen significado en este contexto.
Esta informacin se puede representar en un grfico de barras o en un
grfico circular, como se muestra a continuacin:
Notemos que el grfico circular presenta una gran ventaja visual frente
al grfico de barras, por esta razn se prefiere para representar variables
medidas en escala nominal.
Al tabular el GRADO DE AMARGO, es decir contabilizar que tan amargas
fueron percibidas las cervezas, sin distinguir el TIPO, se obtiene la siguiente
tabla:
G. Amargo| Freq. Percent Cum.
------------+-----------------------------------
0 | 13 26.00 26.00
1 | 19 38.00 64.00
Prof: Natalia Henrquez 10
P r e f e r e n c i a s d e C e r v e z a
0
3 3
t i p o _ d e _ = = 0 . 0 0 0 0t i p o _ d e _ = = 1 . 0 0 0 0
Preferencias de Cerveza
34% tipo_de_== 0.0000
66% tipo_de_== 1.0000
Prof: Natalia Henrquez
2 | 18 36.00 100.00
------------+-----------------------------------
Total | 50 100.00
La informacin que contiene es la siguiente: 13 personas o bien el 26%
de las personas encuestadas encuentran la cerveza levemente amarga, 19
personas o bien el 38% de las personas encuestadas encuentran la cerveza
moderadamente amarga y el resto, es decir 18 personas o el 36% encuentran
la cerveza muy amarga . Notemos que la forma de la tabla es idntica a la
anterior, sin embargo ahora los nmeros en negritas tienen significado, esto
se debe a que la variable est medida en escala ordinal, es decir aparece una
jerarqua en la percepcin de la "amargura" que se refleja en su codificacin,
as el 64%, destacado en negritas, dice que el 64% de las personas
encuestadas perciben la cerveza levemente amarga o moderadamente
amarga. Esta informacin tambin se puede representar en un grfico de
barras o en un grfico circular, sin embargo de dichos grficos no se puede
desprender esta ltima conclusin:
2.3.- Datos en escala intervalar, diagrama de Tallo y hoja, tablas e
histograma.
La ordenacin de datos en escala intervalar, actualmente se realiza
usando el algoritmo llamado Diagrama de tallo y hoja, inventado por Tukey en
1977, consiste en mantener la decena del dato y clasificar la unidad numrica,
si se desea clasificar los nmeros 58, 67, 42, 57, 59 y 45 se procede como
sigue:
Prof: Natalia Henrquez 11
G r a d o d e A m a r g o
0
1 9
g r a d o _ d e = = 0 . 0 0 0 0g r a d o _ d e = = 1 . 0 0 0 0
g r a d o _ d e = = 2 . 0 0 0 0
G r a d o d e A m a r g o
2 6 % g r a d o _ d e = = 0 . 0 0 0 0
3 8 % g r a d o _ d e = = 1 . 0 0 0 0
3 6 % g r a d o _ d e = = 2 . 0 0 0 0
Prof: Natalia Henrquez
4 2 5
5 7 8 9
6 7
Notemos que las unidades, por cada decena, han sido puestas en orden, as
observamos que los nmeros ordenados ascendentemente son 42, 45, 57, 58,
59 y 67.
Veamos un ejemplo: Se tienen las edades, en aos cumplidos, de 30
consumidores de cerveza, los datos se muestran a continuacin:
32 37 42
45 58 35
32 26 19
27 35 31
33 35 46
45 31 35
16 23 22
39 51 27
45 57 36
48 44 32
Si ordenamos estos datos usando el diagrama de Tallo y hoja se obtiene:
1. | 69
2* | 23
2. | 677
3* | 112223
3. | 5555679
4* | 24
4. | 55568
5* | 1
5. | 78
Ahora es fcil observar, por ejemplo que:
1) la persona con menor edad tiene 16 aos
2) la persona de mayor edad tiene 58 aos
3) existen tres personas con 45 aos, etc.
La informacin anterior se puede representar en una tabla, pero como se
ver la prdida de informacin que se produce es bastante considerable, pues
se debe agrupar la informacin. La tabla para las Edades se muestra a
continuacin:
Edad | Freq. Percent Cum.
------------+-----------------------------------
10-20 | 2 6.67 6.67
20-30 | 5 16.67 23.33
Prof: Natalia Henrquez 12
Prof: Natalia Henrquez
30-40 | 13 43.33 66.67
40-50 | 7 23.33 90.00
50-60 | 3 10.00 100.00
------------+-----------------------------------
Total | 30 100.00
Como se observa, la prdida de informacin radica en que, si bien
sabemos que hay 5 individuos con edad entre 20 y 29 aos, no es posible al
observar la tabla cul es la edad exacta de estas personas. Volvemos a
observar que la tabulacin es similar a la hecha para variables ordinales, las
columnas Percent y Cum tienen igual significado que antes, pero adems se
pueden hacer otras comparaciones numricas.
La informacin de la tabla puede representarse grficamente, a este
grfico se le llama Histograma:
Al graficar las frecuencias acumuladas se obtiene un grfico llamado
OJIVA, que se
muestra a continuacin:
Frecuencias ajustadas: Cuando se desea construir un histograma
en que la tabulacin presenta intervalos de clase de distinta longitud,
es necesario ajustar por dichos largos usando la siguiente frmula:
Prof: Natalia Henrquez 13
F
r
a
c
t
i
o
n
E d a d d e b e b e d o r e s d e C e r v e z a
e d a d
1 0 2 0 3 0 4 0 5 0 6 0
0
. 2
. 4
6.67
23.33
66.67
90
100
0
20
40
60
80
100
10-20 20-30 30-40 40-50 50-60
Edad
F
r
e
c
.

A
c
u
m
u
l
a
d
a

e
n

%
Prof: Natalia Henrquez
k
k
k
l
f
f
*
Revisemos el siguiente ejemplo: La siguiente tabla muestra la frecuencia
de accidentes caseros por rango de edad:
Edad frec. largo frec.*
0 - 3 30 3.0 10.00
3 - 5 50 2.0 25.00
5 - 10 40 5.0 8.00
10 - 30 60 20.0 3.00
30 - 60 40 30.0 1.33
60 - 95 35 35.0 1.00
2.4.- Estadgrafos.
Estadgrafos: llamaremos estadgrafo o estadstico, a nmeros
resmenes, que nos permiten establecer conclusiones a cerca de la estructura
de una muestra, estos nmeros son construidos considerando TODA la
informacin que contiene dicha muestra, es decir consideran TODOS los datos
que han sido recolectados. Pueden construirse estadgrafos para distintos fines,
sin embargo estudiaremos cuatro tipos de ellos, estadgrafos de: posicin,
tendencia central, variabilidad y de forma.
Cada vez que la muestra de datos, medidos en al menos en escala
ordinal, ha sido ordenada, se establece un Ranking para cada una de las
observaciones, este ranking, indica en que posicin, en direccin ascendente,
se encuentra el dato respecto a la muestra. Este ranking se denota por un
subndice encerrado entre parntesis. Por ejemplo si se tienen los datos 12, 7,
15 y 13, al ordenarlos se tiene 7, 12, 13 y 15, es decir el primer dato ordenado
Prof: Natalia Henrquez 14
30
50
40
60
40
35
0
10
20
30
40
50
60
70
0 - 3 3 - 5 5 - 10 10 - 30 30 - 60 60 - 95
Edad en aos
N


d
e

a
c
c
i
d
e
n
t
e
s
10.00
25.00
8.00
3.00
1.33
1.00
0.00
5.00
10.00
15.00
20.00
25.00
30.00
0 - 3 3 - 5 5 - 10 10 - 3030 - 6060 - 95
Edad en aos
f
r
e
c
u
e
n
c
i
a

a
j
u
s
t
a
d
a
Prof: Natalia Henrquez
es 7, el segundo es 12 etc. Este hecho lo anotamos simblicamente como
sigue:
X
(1)
=7, X
(2)
=12, X
(3)
=13 y X
(4)
=15
Con esta notacin, si tenemos n datos, el menor valor observado, que
llamaremos el mnimo ser denotado por X
(1)
y el mayor valor observado, que
llamaremos mximo ser denotado por X
(n)
.
Estadgrafos de posicin: son aquellos que dan informacin a cerca
del orden en la estructura de una muestra. Ya hemos mencionado dos de ellos
que aparecen en forma instantnea al ordenar la muestra, nos referimos al
mximo, X
(n)
, y al mnimo, X
(1)
.
Llamaremos PERCENTILES, a cada uno de los nmeros que dividen la
muestra en 100 partes iguales, en consecuencia son 99, y se denotan por P
(k)
,
donde k es el orden del percentil indicado. Dado el percentil P
(k)
, este divide la
muestra en dos partes, la inferior que contiene el k% inferior de las
observaciones y la superior que contiene el (100-k)% de las observaciones.
Para calcular el percentil P
(k)
, se procede como sigue: se multiplica el
tamao de la muestra por k/100, y se ubica la observacin cuyo ranking iguale
o supere por primera vez el nmero calculado. Retomemos el ejemplo de la
muestra de edades de bebedores de cerveza, cuyo tallo y hoja es:
1. | 69
2* | 23
2. | 677
3* | 112223
3. | 5555679
4* | 24
4. | 55568
5* | 1
5. | 78
Aqu nuestro tamao de muestra es n = 30, por lo tanto el percentil P
(k)
es la
observacin cuyo ranking supere o iguale por primera vez 30k/100. Calculemos
P
10
, hacemos la operacin 30 10/100 = 3 es decir buscamos X
(3)
, mirando el
tallo y hoja encontramos que P
(10)
= X
(3)
=22 aos. Calculemos ahora P
70
,
hacemos la operacin 30 70/100 = 21 es decir buscamos P
(70)
=X
(21)
= 42
aos. Por ltimo calculemos P
96
, buscamos X
(30 96/100=28.8)
es decir X
(29)
= 57 aos.
La interpretacin concreta de un percentil es la siguiente, hemos calculado que
Prof: Natalia Henrquez 15
Prof: Natalia Henrquez
P
(70)
= 42 aos, es decir el 70% de los consumidores de cerveza son menores
de 42 aos o bien tienen a lo mas 42 aos, equivalentemente podemos decir
que el 30% mas viejo de los consumidores de cerveza tiene mas de 42 aos.
Hay percentiles, que por la popularidad de interpretacin que tienen,
reciben nombre propio, entre ellos estn:
1) Los Cuartiles: son tres, denotados por Q
1
, Q
2
y Q
3
, que
corresponden respectivamente a los percentiles P
25
, P
50
y P
75
,
ellos dividen la muestra en cuatro partes iguales.
2) Los deciles: son nueve, denotados por D
1
, D
2
,...,D
9
, que
corresponden respectivamente a los percentiles P
10
, P
20
,..., P
90
,
ellos dividen la muestra en diez partes iguales.
En general la manera de calcular percentiles para datos tabulados es:
i
i
i p
n
c
N
pN
LI P
1
]
1

+
1
100
En las salidas computacionales es muy fcil identificar los percentiles,
como se muestra a continuacin:
Edad
-------------------------------------------------------------
Percentiles Smallest
1% 16 16
5% 19 19
10% 22.5 22 Obs 30
25% 31 23 Sum of Wgt. 30
50% 35 Mean 36.13333
Largest Std. Dev. 10.46087
75% 45 48
90% 49.5 51 Variance 109.4299
95% 57 57 Skewness .2114185
99% 58 58 Kurtosis 2.58257
En esta salida se han destacado en negritas los tres cuartiles, Q
1
=31
aos, Q
2
=35 aos y Q
3
=45 aos.
Prof: Natalia Henrquez 16
Prof: Natalia Henrquez
Cuando la informacin se presenta en forma de tabulacin, es decir se
ha perdido informacin debido al agrupamiento, es posible hacer una
aproximacin de los percentiles, esta aproximacin puede afinarse usando una
tcnica de interpolacin lineal, sin embargo para una primera aproximacin,
podemos dar como valor del percentil, el punto medio del intervalo para el cual
se iguala o supera por primera vez el orden del percentil buscado. Como
ejemplo, consideremos la tabulacin de los datos de la Edad, que estamos
analizando:
Edad | Freq. Percent Cum.
------------+-----------------------------------
10-19 | 2 6.67 6.67
20-29 | 5 16.67 23.33
30-39 | 13 43.33 66.67
40-49 | 7 23.33 90.00
50-60 | 3 10.00 100.00
------------+-----------------------------------
Total | 30 100.00
Si deseamos buscar P
10
, miramos en la columna Cum cuando es superado o
igualado por primera vez el 10%, esto ocurre cuando la Edad est entre los 20
y 29 aos, luego entregamos como valor APROXIMADO de P
10
= 25 aos, notar
que el valor para este percentil, calculado a partir del tallo y hoja es de 22 aos
y en la salida computacional es de 22.5 aos. Como se ve el error de
agrupamiento se hace sentir muy fuerte en este caso.
2.5.- Estadgrafos de tendencia central.
Cada vez que se observa un fenmeno cuantitativo, nos interesa saber si
los datos recolectados se aglutinan en torno a ciertos valores representativos
que son propios del fenmeno estudiado. Por ejemplo si pensamos en la Edad
de los jugadores profesionales de ftbol, la experiencia nos dice que sus
edades varan entre los 17 y 35 aos, siendo raro pero no imposible, encontrar
jugadores con mas de 35 aos o menores de 17 aos, adems sabemos que la
gran mayora de estos jugadores tienen entre 23 y 30 aos. Ahora la pregunta
general se hace obvia, dada una coleccin de datos, es posible saber a que
valores tienden dichos datos?, la respuesta la entregan los llamados
estadgrafos de tendencia central.
Prof: Natalia Henrquez 17
Prof: Natalia Henrquez
En consecuencia llamamos estadsticos de tendencia central a aquellos
valores hacia los cuales tienden a aglomerarse los datos de una muestra. Los
mas utilizados son:
1) La Mediana: es aquel valor que divide la muestra en dos
partes iguales, de esta definicin nos damos cuenta que la
mediana no es otra cosa que el Percentil cincuenta o Cuartil 2,
es decir Mediana=P
50
=Q
2
. Notemos que la mediana es tanto
un estadgrafo de posicin y de centralizacin.
2) La Moda: es aquel valor que mas se repite en una muestra y
se denota por M
o
, por ejemplo si consideramos los datos
2,2,3,3,4,4,4,4,5,5 la moda en cuestin es 4. Sin embargo la
definicin dada cobra validez slo si la variable es discreta.
Si la variable es continua, formalmente la moda no existe, pues es
muy difcil que al sacar una muestra de nmeros reales dos o mas
de ellos coincidan. Por ejemplo si se hilara muy fino y midiramos
el peso de las personas en milgramos, sera muy poco probable
encontrar dos o mas personas con igual peso en una muestra,
pero generalmente el peso es medido en kilgramos enteros y en
este caso, como se ha discretizado la variable es posible
calcularla.
Cuando se dispone de un tallo y hoja, la moda corresponde
al valor que mas se repite dentro de la hoja mas grande del tallo.
Retomemos nuestro ejemplo de las edades de los bebedores de
cerveza, el tallo y hoja se muestra a continuacin, donde se ha
destacado en negritas la hoja mas larga:
1. | 69
2* | 23
2. | 677
3* | 112223
3. | 5555679
4* | 24
4. | 55568
5* | 1
5. | 78
Prof: Natalia Henrquez 18
Prof: Natalia Henrquez
observamos que el valor mas repetido en esta hoja es 35 aos,
que corresponde al valor de la moda. Si se dispone de una tabulacin, para
aproximar el valor de la moda, es necesario utilizar la siguiente frmula:
d D
L d L D
M
d i
o
+
+

1 2 1 1
2 1
1
;
+

+

+
i i i i i
n n n n donde c LI Moda
Observacin: los n
i
, es otra manera de simbolizar frecuencias absolutas de la
clase i.
donde: L
i
: lmite inferior del intervalo que contiene la frecuencia
mas alta
L
d
: lmite superior del intervalo que contiene la frecuencia
mas alta
D : diferencia entre la frecuencia mas alta y la del intervalo
siguiente
d : diferencia entre la frecuencia mas alta y la del intervalo
anterior
Veamos el ejemplo respectivo: Consideremos la tabulacin de las
edades, donde se ha ennegrecido el intervalo y la frecuencia
modal:
Edad | Freq. Percent Cum.
------------+-----------------------------------
10-19 | 2 6.67 6.67
20-29 | 5 16.67 23.33
30-39 | 13 43.33 66.67
40-49 | 7 23.33 90.00
50-60 | 3 10.00 100.00
------------+-----------------------------------
Total | 30 100.00
Aqu:
L
i
: 30 aos
L
d
: 40 aos
D : 13-7=6
d : 13-5=8
con lo que: 7 , 35
8 6
40 8 30 6

+
+

o
M aos
Prof: Natalia Henrquez 19
Prof: Natalia Henrquez
valor muy coincidente con el calculado a partir del tallo y hoja.
3) La Media aritmtica o Promedio aritmtico: es el
estadgrafo de tendencia central mas conocido, usado y
abusado. Dada una coleccin de datos X
1
,X
2
,....X
n
, el promedio
se define como LA SUMA DE LOS DATOS DIVIDIDA POR LA
CANTIDAD DE DATOS y se denota por X , en smbolos el
promedio es:

+ + +

n
i
i
n
X
n n
X X X
X
1
2 1
1 ....
formalmente ella representa el Centro de Masas de la muestra, en
la prctica, esto significa que se puede considerar que cada dato
tiene valor igual al promedio. Esta idea no es tan lejana, pues en
el lenguaje corriente, muchas veces se habla del hombre
promedio chileno de la familia promedio chilena, etc. es decir
hablamos de un sujeto TIPO al cual asimilamos a todos los sujetos
estudiados. Obviamente esta asimilacin podra resultar errnea,
como veremos mas adelante.
El promedio aritmtico posee las siguientes propiedades frente a
cambios de escala:
a a
X a X a
a X a X


t t
Veamos un ejemplo numrico: si las calificaciones de un escolar
en matemticas durante un semestre son 5, 6, 3, 5 y 7, su
calificacin promedio es:
2 . 5
5
7 5 3 6 5

+ + + +
x
es decir podemos asumir, que su rendimiento general en
matemticas es 5.2.
Si se dispone de una base de datos de gran tamao, resulta
trabajoso calcular X . En este caso podemos obtener un valor
Prof: Natalia Henrquez 20
Prof: Natalia Henrquez
aproximado para X , a partir de la informacin que contiene una
tabulacin, esta aproximacin se obtiene de
MULTIPLICAR LOS PUNTOS MEDIOS DE CADA INTERVALO
POR LAS RESPECTIVAS FRECUENCIAS, SUMAR ESTOS PRODUCTOS
Y LUEGO DIVIDIR POR LA CANTIDAD DE DATOS. Ejemplifiquemos
usando la tabla de Edad de los consumidores de cerveza.
Edad | Freq. Percent Cum.
------------+-----------------------------------
10-19 | 2 6.67 6.67
20-29 | 5 16.67 23.33
30-39 | 13 43.33 66.67
40-49 | 7 23.33 90.00
50-60 | 3 10.00 100.00
------------+-----------------------------------
Total | 30 100.00
(Tarea calcularla en clase)

Cuando se usa el promedio como medida de centralizacin, debemos
tener cuidado de que los datos sean homogneos, es decir razonablemente
parecidos, pues el promedio es muy sensible a valores extremos, esto es
valores demasiado elevados o demasiado minimizados. En estos casos el
promedio como resumen miente. Por ejemplo, supongamos que
preguntamos por el sueldo, en miles de pesos, a cinco personas que ofician de
ascensoristas en edificios distintos, obteniendo 140, 150, 142, 160 y el sueldo
del ltimo encuestado sea 350, puesto que trabaja para una Empresa de
Ensueos, al observar los datos vemos que los sueldos de los ascensoristas, en
general estn alrededor de los $ 150 mil, sin embargo si los promediamos
tenemos que dicho promedio es de $ 188.400, obviamente esta distorsin se
produce por el astronmico sueldo de $ 350 mil. En estos casos, lo justo es no
incluir en el promedio el sueldo astronmico, con lo que el promedio es de $
148 mil o bien en vez del promedio usar el valor mediana que es $ 150 mil, lo
que concuerda con la realidad que estamos estudiando.
2.6.- Estadgrafos de variabilidad.
Acabamos de ejemplificar una situacin en que los datos analizados no
son homogneos, cuando se tienen pocos datos, por simple inspeccin
sabramos si los datos son homogneos o heterogneos. Sin embargo resulta
Prof: Natalia Henrquez 21
Prof: Natalia Henrquez
extremadamente til manejar medidas para la variabilidad, con el objeto de
establecer comparaciones posteriores. Consideremos las calificaciones en
estadstica de dos alumnos: Pedro y Pablo
Alumno Promedi
o
Pedro 4.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0
Pablo 2.0 3.0 7.0 4.0 6.0 5.0 1.0 4.0
Como es observa, tanto Pedro como Pablo tienen idntico rendimiento
promedio. Sin embargo quin tiene rendimiento mas homogneo?, por
inspeccin vemos que Pedro, pues obtuvo slo notas 4.0, mientras que Pablo
obtuvo toda la gama de notas. Para contestar la pregunta propuesta mediante
el uso de indicadores estadsticos se desarrollaron los ESTADIGRAFOS DE
VARIABILIDAD. Aqu presentaremos slo dos de ellos:
1) Rango o Recorrido: se define el rango o recorrido de los datos como
el mximo menos el mnimo, en smbolos: ) 1 ( ) (
X X Rango
n


En nuestro ejemplo Rango(Pablo)=6 y Rango(Pedro)=0. Observamos que
mientras mas heterognea es la coleccin de datos mayor es el valor del
rango. Sin embargo el Rango puede exagerar el grado de
heterogeneidad del los datos, para prevenir este hecho se prefiere usar
como medida de variabilidad la conocida
2) Desviacin Estndar: para definir la desviacin estndar,
previamente presentaremos lo que se llama desviacin de un dato
respecto al promedio, que denotamos por d
i
as
X X d
i i

, es decir
la diferencia entre cada dato y el promedio.
En consecuencia definimos la Desviacin Estndar, denotada por S
x
o

x
como:
( )
n
X X
n
d d d
S
n
i
i
n
x
2
1
2 2
2
2
1
...

+ + +

Prof: Natalia Henrquez 22


Prof: Natalia Henrquez
El cuadrado de la desviacin estndar recibe el nombre de VARIANZA, es
decir:
( )
n
X X
n
d d d
X Var S
n
i
i
n
x
2
1
2 2
2
2
1 2
...
) (

+ + +

es decir es LA RAIZ CUADRADA DE LA SUMA DE LOS DESVIOS ELEVADOS
AL CUADRADO DIVIDIDO POR LA CANTIDAD DE DATOS MENOS 1.
Por ejemplo calculemos la desviacin estndar para las notas de
Pablo, para ello dispongamos las notas as:
Nota Desvo=Nota-Prom Desvo
2
2 -2 4
3 -1 1
7 3 9
4 0 0
6 2 4
5 1 1
1 -3 9
Suma=28
As
2
7
28
7
28 ...
2 2
2
2
1

+ + +

n
d d d
S
n
x

La interpretacin de la desviacin estndar, bajo ciertas
condiciones de regularidad, es que la mayora de los datos est entre
EL PROMEDIO MENOS LA DESVIACION y EL PROMEDIO MAS LA
DESVIACION, lo que en el ejemplo es que las notas de Pablo estn entre
4-2 y 4+2, es decir entre 2.0 y 6.0, lo que es bastante real.
Para obtener una medida mas interpretable del grado de
heterogeneidad solamente, es til definir el COEFICIENTE DE
VARIABILIDAD que se entrega como un valor porcentual y se define
como 100 por el cuociente entre la desviacin estndar y el promedio,
en smbolos:
% 100 . .
X
S
V C
x
Prof: Natalia Henrquez 23
Prof: Natalia Henrquez
Para nuestro ejemplo % 55 % 100
0 . 4
2 . 2
. . V C , es decir un 55% de
variabilidad, que es moderadamente alto.
Criterio para determinar si los datos son homogneos o Heterogneos:
Si el
% 5
X
CV
los datos se dirn muy homogneos.
Si
% 25 % 5 <
X
CV
los datos se dirn homogneos.
Si
% 50 % 25 <
X
CV
los datos se dirn heterogneos.
Si
% 50 >
X
CV
los datos se dirn muy heterogneos.
Ejemplifiquemos esto, calculando la desviacin estndar para la Edad de los
consumidores de cerveza, cuya tabulacin es la siguiente:
Edad | Freq. Percent Cum.
------------+-----------------------------------
10-19 | 2 6.67 6.67
20-29 | 5 16.67 23.33
30-39 | 13 43.33 66.67
40-49 | 7 23.33 90.00
50-60 | 3 10.00 100.00
------------+-----------------------------------
Total | 30 100.00
Calcular en clase y comprobar que:
10
x
S
aos.
La varianza posee las siguientes propiedades frente a cambios de escala:
0 ) (
) ( ) (
) ( ) (
2


t
a Var
X Var a X a Var
X Var a X Var
Si deseramos calcular el coeficiente de variabilidad, a partir de la salida
computacional, no hay problemas pues disponemos de todos los elementos
necesarios para este efecto, la rpida evaluacin de la frmula nos lleva a:
% 0 . 29 % 100
13 . 36
46 . 10
% 100 . .
X
S
V C
x
Lo que indica bastante homogeneidad de los datos. En conjunto, el promedio y
la desviacin estndar, indican que la mayora de las Edades de los
consumidores de cerveza fluctan entre los 25.7 y 46.6 aos.
Prof: Natalia Henrquez 24
Prof: Natalia Henrquez
2.7.- Estadgrafos de forma.
Son aquellos nmeros resmenes, que indican la morfologa de la distribucin
de los datos, es decir de la simetra y apuntamiento que tiene el histograma de
la variable en estudio. Se estudiarn dos estadgrafos alusivos:
Sesgo: mide el grado de asimetra, respecto de la moda, que tienen
los datos. Una forma de medir el sesgo es usando la frmula:
s
M x
Sesgo
o

Sesgo = 0 Sesgo > 0 Sesgo < 0


Curtosis: mide el grado de apuntamiento que tienen los datos. Una
forma de medir la curtosis es usando la frmula:
( )
10 90
1 3
2
1
P P
Q Q
K

Tabla de resumen para las medidas antes mencionadas, cuando se les aplica
alguna transformacin a los datos:

Transformacin Indicador Inicial Modificado
Prof: Natalia Henrquez 25
Prof: Natalia Henrquez
i
x
se transforma en
b x a
i
+ *
Promedio X
b X a + *
Moda Moda b Moda a + *
Percentil x x
P b P a
x
+ *
Varianza
2
S
2 2
* S a
Desviacin
Estndar
S S a*
Coeficiente
de variacin
X
S
CV
b X a
S a
CV
+

*
RECORDAR:
Si n es Impar mediana =

,
_

+
2
1 n
X
, Si n es par, Mediana =
2
) 1
2
( )
2
( +
+
n n
X X
Para datos agrupados: Mediana=
i
i
i i
n
c
N
n
LI ) -
100
* 50
(
1 -
+
.
P

=
i
i
i i
n
c
N
n
LI ) -
100
*
(
1 -

+
EJERCICIOS.
1.Cul es el nivel de medicin que reflejan los siguientes datos.
a) La edad de 50 adultos que escuchan la radio cooperativa.
b) En un estudio de 200 propietarios de autos de lujo, 100 fueron de
California, 50 de Nueva York, 30 de Illinois y 20 de Ohio.
c) Una clasificacin de estudiantes segn la comuna en que nacieron.
d) Calificaciones de los estudiantes en la primera prueba de estadstica.
Prof: Natalia Henrquez 26
Prof: Natalia Henrquez
e) El nmero de horas que un estudiante ocupa en estudiar estadstica a la
semana.

2.La empresa Market Facts de Chicago pidi a una muestra de 1960 consumidores
probar un platillo de pescado congelado desarrollado por Morton llamado Delicia del
pescado. De los 1960 encuestados, 1176 dijeron que compraran el platillo si lo ponan
a la venta.
Qu informacin Market Facts a Morton Foods respecto a la aceptacin de delicia del
pescado por la poblacin?
Es este un ejemplo de estadstica descriptiva o inferencial?
II.
1. La produccin de una empresa en sus 20 filiales fue la siguiente expresada en
miles:
4,5,3,5,6,5,6,3,2,7,4,3,6,5,5,2,7,3,5,4.

hallar la media aritmtica, la mediana, la moda, el rango, la desviacin media,
la varianza y desviacin tpica, el coeficiente de variacin.
2. En las tablas siguientes se pide calcular, las medidas de la pregunta 1.
N de hijos N de familias
0 10
1 23
2 27
3 18
4 14
5 8
Total

IDEM CON
Duracin
de
baterias
N de
baterias
24 28 8
29 33 12
34 38 18
39 - 42 14
43 - 47 8
Total
Prof: Natalia Henrquez
Notas N de alumnos
2 4
3 8
4 17
5 10
6 5
7 2
total
27
Prof: Natalia Henrquez
3.En una industria donde trabajan 512 operarios, el salario medio alcanz a $24000.
Qu sucede con este promedio si ?:
a) se aumentan todos los salarios en $6000 diarios?
b) Se aumentan todos los salarios en 25%?
c) Se aumentan todos los salarios en 15% ms $2700 diarios?
4.El promedio de las notas de un curso de 30 alumnos fue 52, los 6 primeros
obtuvieron un promedio 80 y los ltimos 10 sacaron promedio 31.
Calcular el promedio de los alumnos restantes.
5.La media aritmtica de dos nmeros es 15 y su media geomtrica es 12.
Calcular ambos nmeros.
6.
7.En una empresa los salarios medios han tenido un promedio de $15000 diarios con
una
desviacin tpica de $8500.
Qu sucede con la varianza de los salarios, si los salarios:
a) se aumentan en $1000 diarios?
b) Se aumentan en 10%?
c) se efectan aumentos simultneamente?
8.Las notas de un curso A en matemticas tuvieron una media de 75 y una varianza de
225. Los del curso B tuvieron una media de 70 y una varianza de 196.
Si en ambos cursos las notas aumentan en 10% Cul de los dos cursos tiene un
coeficiente de variacin mayor despus de bonificar la notas?.
9.Se disea un puente para soportar una carga mxima de 55000 libras. Si en un
momento se le carga con 15 vehculos que tiene un peso medio de 3000 libras.
Est sobrecargado el puente?.
10.Un estudiante obtuvo 70, 80 y 90 puntos en su primer examen, en el intermedio y
en el final, respectivamente, si el profesor piensa que el examen intermedio es dos
veces ms importante que el primero y que el final es 1,5 veces ms importante que el
intermedio. Cul es el promedio final ponderado?.
11.Sea
s
x x
z
i

los puntajes z o estandarizados.


Probar que la media de z es cero y la varianza de z es 1.
12.Los sueldos promedios de las secciones A, B, C de una empresa son
respectivamente $300000, $435000 y $700000.
El nmero de empleados de cada seccin es 100, 80 y 20 respectivamente.
a) Calcular el sueldo promedio de la empresa.
Prof: Natalia Henrquez
Temperatu
ra
N de das
0,0 6,5 32
7,0 13,5 44
14,0 20,5 104
21,0 26,5 88
27,0 31,5 57
32,0 38,5 40
total
28
Prof: Natalia Henrquez
b) Si la empresa decide un aumento de un 20% para la seccin A, 15% para la
seccin B y 12% para la seccin C.
Calcule el sueldo promedio por seccin y para la empresa despus del
aumento.
13.Complete la tabla sabiendo que 08 . 6 x y que la amplitud del intervalo de clase
es constante.
Adems, calcule la mediana, la moda y la desviacin tpica.
14.Una firma est comprando 2 marcas de una mquina de empacar un promedio de
100 clavos con un mnimo de variacin.
Se ha hecho 1000 pruebas con cada una y los resultados se indican en la tabla.
N de clavos por
paquete
Mquina
A
Mquina B
97 35 10
98 50 45
99 60 120
100 700 655
101 75 130
102 50 10
103 30 30
Total 1000 1000
a) construya los polgonos de frecuencias relativas.
b) Calcule la media y la varianza de cada mquina.
c) Calcule el coeficiente de variabilidad de cada mquina.
d) En base a la informacin anterior, determine qu mquina conviene adquirir.
15.Una muestra de 70 datos para una variable da una media de 120 y una desviacin
tpica de 6. Otra muestra de 30 datos, da para la misma variable una media de 125, y
una desviacin tpica de 5. Si se renen las dos muestras formando una sola muestra
de cien datos. Cul ser su media y su varianza?
Prof: Natalia Henrquez
Clases
i
x
i
n
i
N
i
h
i i
n x
1,0 3,0
3,0 5,0 20
5,0 - 180
90
10
Total N=
29
Prof: Natalia Henrquez
16.En un curso secundario hay 35 hombres con una edad media de 17,5 aos y 15
mujeres las que, en promedio, son un 25% ms jvenes. Cul es la edad media del
curso?
17.El ingreso percpita en un pas es de US$310.
El sector obrero, que constituye el 50% de la poblacin, percibe 1/5 o 20% del
ingreso total.
Calcule el ingreso promedio del sector no obrero.
18.La produccin de la fbrica A es el triple de la B y la de esta un 18% inferior a la C.
Si los costos unitarios correspondientes ( todos inferiores en 20% a su respectivo precio
de venta) son de $20, $24, $26 se pide calcular el precio promedio de venta.
19.El precio medio de un centenar de artculos es de $85,70.
Los artculos se dividen en dos grupos, con media $75,8 y $97,8.
Cuntos artculos hay en cada grupo?
20. Completar la tabla si 32 x y los intervalos son de igual tamao ( justifique sus
clculos).

21.Una sucursal de una empresa embotelladora en sus secciones de Papayas, Malta,
Bilz y Pilsener, posee la siguiente informacin.

Calcular el coeficiente de variacin total.
22.En un ciudad, la poblacin en el ao 1950 fue de 60 mil personas.
a) Cul fue la poblacin media del periodo, si en 1960 la poblacin alcanz a 220
mil habitantes?
b) Cul es la tasa anual de crecimiento?
c) Estime la poblacin para el ao 1970.
SEGUNDA PARTE DE DESCRIPTIVA
1.Identifique cul fue la medida que se utiliz en los casos siguientes:
Prof: Natalia Henrquez
Clases
i
x
i
n
i
N
i
h
i
H
i i
n x
i i
n x
2
5 - 15
15
-
800
58.50
0
0.85
- 55 200
Total
PRODUCTO N de
Mquinas
Producto por
mquina
Coeficiente de
variacin
PAPAYA 3 4 millones 0,5
MALTA 4 5 millones 0,6
BILZ 1 4 millones 0,5
PILSENER 2 2 millones 0,2
30
Prof: Natalia Henrquez
a) Si todos los nacidos vivos pesaran lo mismo, sus pesos seran de 2950 grs.
b) La mitad de los escolares tiene seis caries o ms.
c) El diagnstico que ms se repite en la consulta infantil es resfro comn.
d) La variabilidad con respecto al promedio de la estada hospitalaria es de 1,9 das.
e) El 8 % de la poblacin de Santiago tiene ms de 65 aos.
f) El 35% de la poblacin de Chile tiene 15 aos o menos.
g) Ocho caries es la diferencia entre el escolar con ms caries y el con menos caries.
h) La cuarta parte de una poblacin tiene un peso de 60 kg o ms.
2.El Departamento de control de calidad de la fbrica de automviles SHO-CHAN,
examina 800 vehculos en busca de posibles detalles en su pintura, ensamblaje,
carburacin, etc.
En la revisin se constat que:
a) 80 autos no tenan ninguna falla.
b) 640 tenan a lo ms 4 fallas.
c) 280 tenan menos de tres fallas.
d) El 20% de los autos tena a lo ms una falla.
e) El 15% tena tres fallas.
f) Ningn auto examinado present ms de cinco fallas.
A partir de esta informacin construya una tabla de distribucin de frecuencias que
incluya frecuencias simples y acumuladas, absolutas y relativas. Determine adems el
promedio de fallas de cada auto.
3.La siguiente tabla resume los datos de tres cursos en cuanto al nmero de alumnos
n, nota promedio x , desviacin estndar s y coeficiente de variacin c.v.

Curso N
x
S c.v
A 30 5.5 1,76
B 5.0 15%
C 50 1.35 30%
Total 120
Complete la tabla , determinando:
a)tamao del curso B.
b)nota promedio curso C.
c)desviacin estndar curso B.
d)coeficiente ponderado de los tres cursos.
4.En un programa de auto-enseanza, aplicado a un grupo de 110 estudiantes, se les
entreg una bibliografa compuesta de cuatro textos para que prepararan una prueba.
Las calificaciones obtenidas y los libros consultados por los estudiantes se encuentran
resumidos en la siguiente tabla:
Nota obtenida Libros consultados
0 1 2 3 4
Total
2 10 8 4 2 0 24
3 5 8 3 2 1 19
4 2 4 10 4 6 26
5 0 1 6 1 7 24
6 0 0 2 5
10
17
Total 17 21 2 5 23 110
Prof: Natalia Henrquez 31
Prof: Natalia Henrquez
24
De acuerdo con esta informacin, indique el valor y seale el significado de :
4 3 2 4 3 3
; ; ; )

h h n n n a
b) Determine las medias marginales y seale su significado.
c) Calcule el promedio de libros consultados en el grupo de estudiantes que obtuvo
nota
inferior a 4.
d) Calcule la nota promedio de los alumnos que consultaron 3 libros.
5. La comisin Nacional de Ciencias y Tecnologa le preocupa la escasez de Tcnicos
Superiores en Electrnica-Computacional ( TSEC) que parece estarse previendo para el
futuro. Para investigar el grado de satisfaccin con la profesin entre los TSEC, se ha
patrocinado un estudio en centros especializados del rea de todo el pas. Como parte
de este estudio se pidi a 50 tcnicos superiores que indicarn el grado de satisfaccin
en el trabajo, en el sueldo y oportunidades de ascenso. Cada uno de los tres aspectos
de satisfaccin fue medido en una escala de 0 a 100 donde los valores mayores
representan mayores niveles de satisfaccin. Se reunieron los datos, adems se
clasificaron segn el tipo de centro de trabajo. Los tipos privados (P), administracin
estatal (AE) y universitarios(U).
Aplique los mtodos de la estadstica descriptiva para resumir los datos. Presente
resmenes que tengan inters para otras personas.
Describa lo que encontr; especficamente, haga comentarios sobre los asuntos
siguientes:
1. Con base en todo el conjunto de datos y en las tres variables de satisfaccin en el
trabajo qu aspecto del trabajo satisface ms a los tcnicos? cul parece ser
el que menos lo satisface?. Describa sus razonamientos.
2. Segn las medidas descriptivas de la dispersin, qu indicador de satisfaccin
con el trabajo parece generar la mxima deferencia de opinin entre los tcnicos?
Explique.
3. Qu puede decir acerca de los tipos de Centros?hay algn tipo determinado de
centro laboral que parezca tener mejores niveles de satisfaccin en el trabajo que
otros?sugieren los resultados algunas recomendaciones para tratar de conocer y
de mejorar la satisfaccin con el trabajo?. Describa sus razonamientos.
4. Qu medidas descriptivas adicionales puede emplear usted para conocer y
posiblemente, mejorar la satisfaccin en el trabajo?
5. Construya una distribucin de frecuencia utilizando 4 intervalos de clase en cada
una de las variables y los tipos de centros de trabajo.
6. Construya un grfico adecuado para cada variable. Explique las frecuencias que
estn representadas en el dibujo que ha construido.
7. Segn los clculos brindados en cada variable y clasificacin que puede decir de la
forma de los datos.
Prof: Natalia Henrquez 32
Prof: Natalia Henrquez
8. Determine las medidas de centralidad con los datos agrupados en los tres tipos de
centros de trabajo, pero con la variable sueldo ( solamente ). Usted encuentra
diferencia alguna con los clculos brindados? qu puede decir de estos
estadsticos
encontrados? cul cree usted que es ms preciso? Haga sus comentarios.
Centro Privado Administracin
Estatal
Centro Universitario
Trabajo Sueldo Ascenso Trabajo Sueldo Ascens
o
Trabajo Sueldo Ascens
o
72 57 40 71 49 58 84 53 63
90 62 66 84 74 37 87 66 49
84 42 66 72 37 86 72 59 79
85 56 64 63 48 78 88 55 52
71 45 68 84 60 29 74 70 51
88 49 42 73 56 55 85 89 46
72 60 45 94 60 52 79 59 41
88 36 47 90 27 67 69 47 16
77 60 75 72 76 37 90 56 23
64 43 61 86 37 59 77 90 51
71 25 44 86 72 72 71 36 55
84 28 62 95 66 52 75 53 92
70 38 54 65 42 68 76 51 54
87 51 57 82 37 54 89 80 64
74 59 82 82 60 56
89 66 62 90 76 70
85 57 67 78 52 72
74 47 63
82 49 91
Suma 1507 930 1156 1367 929 1002 1116 864 736
10
P
70.8 34.4 43.6 68.6 37 37 71.3 48.2 28.4
1
Q
72 42.5 50.5 72 42 52 74.25 53 46.75
2
Q
82 49 62 82 56 58 78 57.5 51.5
3
Q
86 58 66.5 88 69 71 86.5 69 61
90
P
88.2 60.4 76.4 91.6 74.8 74.4 88.7 86.3 74.5
Desv.E
st
8.03501
11
11.53 13.53 9.7 15.3 15.23 7.27 15.7 19.43
6.Seale la respuesta correcta:
1. - Un Mdico Veterinario dice: La gran mayora de los animales se
recuper por
causa del tratamiento, entonces, se est refiriendo a:
a) La Mediana.
b) La Media.
c) La Moda.
d) Frecuencia Absoluta Acumulada.
e) N.A.
Prof: Natalia Henrquez 33
Prof: Natalia Henrquez
2. - Al decir un Preparador: Del corral, slo cinco caballos estn enfermos,
se est refiriendo a:
a) La Mediana.
b) La Moda.
c) La Media.
d) La Frecuencia Relativa.
e) N.A.
3. - Al decir un Mdico Veterinario: La mitad de los animales supera los 300
Kgs., se est refiriendo a:
a) La Media.
b) La Mediana.
c) La Moda.
d) La Frecuencia Relativa.
e) N.A.
7. Un criador tiene 10 animales para mejorarlos genticamente, de los cuales
cinco de ellos pesan 500 kgs., dos pesan 600 kgs. y el resto 750 kgs. El
criador, piensa que el peso medio supera al peso mediano. Qu puede decir
Ud. al respecto, justifique.
8. En cierta poblacin de animales, se encuentra la siguiente informacin.
SANOS ENFERMOS
MACHOS 400 100
HEMBRAS 1200 600
a) Qu porcentaje de la poblacin de animales est sana.
b) Son las hembras ms propensas a enfermarse, justifique.
c) Si los animales se agrupan por sexo, determine e interprete la medida
de tendencia central ms adecuada.
9.Cierto genetista analiza la informacin de 80 pequeos animales que posee
en su laboratorio, los cuales presentan un peso que flucta entre los 100 y 700
grs. Al enviar a un Mdico Veterinario para que los analice, ste le informa al
genetista que: 20 de ellos tienen un peso inferior a los 300 grs. Y 10, estn
con un peso de al menos los 500 grs., es decir, con sobrepeso.
Determine:
a)El peso ms frecuente o ms comn que presentan estos animales.
b)Cuntos animales tienen un peso superior a 350 grs?.
c)El genetista sabe que la altura media de estos animales es de 15 cms. con
una desviacin de 3 cms. Cul de las dos variables es ms homognea?.
Prof: Natalia Henrquez 34
Prof: Natalia Henrquez
10.Un ingeniero de cierta empresa desea hacer un anlisis del balance, para
ello considera los saldos de las 3000 cuentas y extrae una muestra aleatoria de
slo 100 de ellas, obteniendo los siguientes resultados.
SALDO DE CUENTAS (MILES DE $) NUMERO DE CUENTAS
0 200 15
200 400 25
400 600 30
600 800 22
800 1000 18
Si el saldo de cada cuenta se incrementara en un 6% ms $ 50.000, cul
sera el
nuevo saldo medio.
a)Determine el porcentaje de variabilidad en las cuentas.
b)Qu porcentaje de cuentas no supera los $ 500.000?
11. Se registr el nmero de veces que algunos deportistas obtuvieron el
primer lugar en competencias deportivas, observndose lo siguiente:
Deportista A B C D E F
Nm. De veces 6 5 8 5 4 6
a)Identifique la variable, su tipo y escala de medida.
b)Determine si el porcentaje de variabilidad supera el 15%.
c)Cul es el nmero de veces ms comn que han obtenido primer
lugar estos
deportistas? Qu nombre recibe este indicador?
d)Determine la mediana.
12.Se desean comparar los tiempos que demoraron en algunas prcticas
deportivas los participantes de dos Grupos, los que se observan en lo que sigue:
Tiempo en
segundos
Nmero de
participantes
Grupo1
25 a 35
35 a 45
45 a 55
55
a 65
3
8
15
8
Prof: Natalia Henrquez
Tiempo en
segundos
Nmero de
participantes
Grupo2
25 a 35
35 a 45
45 a 55
55
a 65
9
10
8
2
35
Prof: Natalia Henrquez
a. Determine el tiempo que demoran con mayor frecuencia los
participantes del Grupo1.
b. Puede Ud. afirmar que el tiempo medio en las prcticas del grupo 1
es superior al tiempo medio que demoran las prcticas del grupo 2?
Interprete en trminos de qu grupo es, en media, ms rpido.
c. Qu porcentaje de participantes del grupo 2 demoran al menos 55
segundos en sus prcticas?
d. A las personas ms rpidas, aquellas que demoran menos de 35
segundos; se les ofrecer pertenecer a un equipo de seleccin, Qu
porcentaje recibir el ofrecimiento?
13. En un curso las notas obtenidas por algunos alumnos fueron las siguientes:
4, 5, 6, 4, 6, 7, 3, 4, 5, 4, 4, 1.
Determine:
a)La nota media.
b)La nota ms frecuente.
c)Una nota que la supere el 50% de los alumnos.
14.La siguiente tabla, muestra el valor de la matrcula que cobran algunos
colegios:
Valor Matrcula ($) Nro. De Colegios
50.000 60.000 20
60.000 70.000 31
70.000 80.000 49
Determine:
a) El valor medio de matrcula cobrado por estos colegios.
b) El valor de la matrcula ms comn cobrado por estos colegios.
c) Un valor de la matrcula, de manera que el 50% de los colegios supere
este
monto.
d) El porcentaje de variacin de la variable.
15. Cada uno de los apoderados que asintieron a la reunin mensual, dieron
una cuota voluntaria, que son mostradas a continuacin (en $):
400, 500, 600, 400, 600, 700, 300, 400, 500, 400, 400, 1.000 Determine:
a) El monto de la cuota media.
b) El monto de la cuota ms comn.
Prof: Natalia Henrquez 36
Prof: Natalia Henrquez
c) El profesor piensa que el 50% de los apoderados dio ms de $ 380,
Qu puede
decir Ud., Justifique.
16.Se cuenta con la distribucin del peso (en kilos), de algunos caprinos, los
que se muestran a continuacin:
Peso Caprinos
2,0 a 2,8
2,8 a 3,6
3,6 a 4,4
4,4 a 5,2
10
17
12
6
a) Determine la variabilidad en los pesos de estos caprinos.
b) Qu porcentaje de caprinos pesan como mnimo 4,0 kilos?
c) Cul es el nivel de peso que se observa con mayor frecuencia en este
grupo de
caprinos?
d) Cierto investigador al analizar la informacin argumenta que, la altura
de los
caprinos tiene media de 60 cms con desviacin 10 cms.
Determine que variable es ms homognea.
17. La siguiente tabla, muestra el precio de algunos vehculos especiales:
Valor Vehculo (M$) Nro. De Vehculos
50.000 60.000 20
60.000 70.000 31
70.000 80.000 49
Determine:
a) El precio medio de estos vehculos.
b) El precio del ms comn de los vehculos.
c) Un precio, de manera que el 50% de los vehculos supere dicho
monto.
SOLEMNE
1. Los salarios de una empresa son en promedio de $122500 al final de
un periodo dado. Con posterioridad se incorpora a la empresa un grupo
de obreros igual al 25% de los que haba originalmente. El nuevo grupo
ingresa a la empresa con un salario medio igual 60% de los antiguos.
Dos meses ms tarde la empresa concede un aumento de salario de
$17500.
Determine:
a)Cul es el salario promedio de todos los obreros?.
Prof: Natalia Henrquez 37
Prof: Natalia Henrquez
b) Si el aumento hubiese sido del 20% Cul habra sido el salario medio
reajustado?.
2. Suponga que en una encuesta a 800 familias se les consulta sobre
dos puntos: Si estn o no inscritos en los registros electorales y sobre
sus ingresos, de donde se obtiene la siguiente tabla:

Ingresos (en miles de
pesos)
Inscritos en Registros Electorales
Si No Total
100 a 400 120 320
400 a 700 150 240
700 a 1000 210 30
Total 420 800
a) Qu resulta ms frecuente en cuanto a inscritos en los Registros
Electorales?.
b) Es el monto medio de ingreso inferior al monto mximo del 50% de
personas
que tienen los menores ingresos?.
c) Cuntas personas ganan entre $350.000 y $500.000, si estn
inscritos en los
Registros Electorales?.
3. a) A continuacin se muestran las notas obtenidas por algunos
alumnos de dos cursos distintos:
Curso A 4 3 3 6 2
Curso B 5 6 5 4 5
A partir de esta informacin: Obtenga el coeficiente de correlacin de
Spearman
(
s
r
) entre las notas del curso A y B.
b) V o F ( justifique las falsas)
---- Si dos sucesos son independientes entonces son disjuntos.
---- Los coeficientes de correlacin de Pearson varan entre 1 y +1.
---- Un coeficiente de correlacin negativo entre X e Y significa que no
existe relacin entre las variables.
4. Se lanza un par de dados. Si dos de los nmeros que aparecen son
diferentes, encontrar la probabilidad de que:
a) la suma sea seis. b) aparezca un uno. c) la suma sea 4 o menos.
Prof: Natalia Henrquez 38
Prof: Natalia Henrquez
5. Se sabe que las acciones sufren alzas y bajas. Se realiza un
estudio en la Bolsa de Valores de Santiago, obteniendo la
siguiente informacin : el 25% de las acciones corresponden al
sector servicios (S), el 30% al sector industrial y exportaciones (I)
y el 45% restante a los dems sectores de la economa (O).
Durante los cuatro das que dur el estudio, en el sector servicios
baj el 25% de las acciones, en el sector industrial y
exportaciones baj el 38% de las acciones y en los dems
sectores de la economa baj el 33% de las acciones.
Se toma al azar una accin, transada en la Bolsa de Valores de
Santiago:
a.- Con qu probabilidad es una accin que present alza?.
b.- Si la accin tomada al azar sufri una baja, Cul es la probabilidad
de que se trate de una accin del sector servicios?

Referencias
Apuntes del profesor Gabriel Cavada.
Apuntes de la profesora Natalia Henrquez.
Apuntes varios.

ANLISIS BIVARIADO
Objetivo General: Interpretar informacin interrelacionada
Objetivos Especficos:
Aplicar indicadores especficos, en el anlisis de dos variables.
Reconocer el uso de indicadores en situaciones diarias.
Contenidos:
Media condicionada
Covarianza.
En muchas ocasiones, hay inters por observar como se distribuyen los
individuos o elementos, cuando se les miden dos o ms, variables a la vez,
pero no slo observando a cada variable en forma univariada sino que
considerndolas combinadas, permitindonos ver el efecto conjunto entre
ellas.
Prof: Natalia Henrquez 39
Prof: Natalia Henrquez
Llamaremos X
i
, X
j
a cada una de las variables con i=1,2,...,k niveles o
intervalos o clases para la variable X , y j=1,2,...,l niveles o intervalos o
clases para la variable Y.
La variable X se puede disponer en las filas y la variable Y, en las columnas,
registrndose para ellas la informacin conjunta n
ij
, de los pares ordenados
( X
i
;X
j
) en el centro de la tabla.
En la tabla se, definirn los siguientes valores:
k
x x x x ,..., , ,
3 2 1
sern las k marcas de clase para la variable X, mientras que
l
y y y y ,..., , ,
3 2 1
sern las l marcas de clase de la variable Y.
Las n
ij
sern las frecuencias absolutas conjuntas de cada par (X
i
, X
j
) , que
indicarn el nmero de casos o elementos que pertenezcan a la categora i ( de
X ) , y j ( de Y).
n
i
ser la frecuencia absoluta para la variable X
i
, que llamaremos
frecuencia marginal de X , mientras que n
j
ser la frecuencia absoluta para la
variable Y
j
, que llamaremos frecuencia marginal de Y, n es el total de casos en
el estudio.
Puntajes m
c
(X)
Edades de postulantes.
25 a 27 27 a 29
m
c
(Y) 26
28
Total Marginal de
X
30 a 40 35 5 10 15
40 a 50 45 6 10 16
50 a 60 55 10 8 18
Total Marginal de
Y
21
28
49
A partir de esta tabla podemos obtener resultados para cada variable de
manera univariada, resultados para ambas variables a la vez, ( conjunto), y
resultados parciales para cada una de las variables. Estos resultados se
conocen como anlisis marginales, conjuntos y condicionales respectivamente.
De la misma manera anterior podemos preguntarnos por ejemplo:
Cul es la edad media de estos postulantes?.
Son los puntajes homogneos?.
A cunto alcanza el puntaje medio para aquellos postulantes que
tienen como mnimo 27 aos?.
Cul es la edad media de los postulantes que obtuvieron sobre 50
puntos?.
la edad estar relacionada con el puntaje obtenido?.
Solucin:
Prof: Natalia Henrquez 40
Prof: Natalia Henrquez
Para calcular la edad media ocuparemos la cuarta fila con su
respectiva marca de clase en este caso.
n
n y
l
j
j j
Y

, aos
Y
14 , 27
49
1330

En este caso se debe calcular la media y desviacin estndar para la
variable X, utilizando los procedimientos vistos en el anlisis
univariado, obtenidose:
% 144 . 17
61 . 45
8216 . 7
, 8216 . 7 , 61 . 45
X X X
CV , luego los
puntajes son homogneos .
Aqu se realiza un anlisis condicional:
286 . 44
28
1240
27 /

> Y X

Para calcular la media de la edad de estos postulantes, bajo la


condicin dada tenemos:
29 . 27
31
846
50 /

X Y
.
En esta parte debemos calcular si existe alguna relacin entre las
variables es decir determinar la variacin conjunta, para esto
definiremos una medida llamada Covarianza y se determina de la
siguiente manera:
Y X
k
i
l
j
ij j i
XY
n
n y x
Cov

1 1


donde
X
,
Y
son las medias
respectivas.
Para el ejemplo se tiene:

3248 . 1 8554 , 1237 5306 , 1236 , 14 . 27 , 61 . 45
XY Y X
Cov
Si bin la varianza siempre d positiva la covarianza puede dar negativa
y el signo indicar si existe asociacin directa en el caso de dar positiva e
inversa en el caso de ser negativa, es decir a medida que la edad disminuye el
puntaje aumenta en el caso del ejemplo.
Ejercicio
Prof: Natalia Henrquez 41
Prof: Natalia Henrquez
1. Los datos que siguen corresponden al sueldo mensual de ciertos empleados,
expresados en miles de pesos $(X), y el nmero de horas semanales laborales
de ellos (Y).
a) Deter
mine
el
sueldo promedio y tiempo laboral promedio de estos empleados,
Qu variable presenta menor dispersin relativa?.
b) Cul es el nmero de horas ms comn que laboran estos
empleados? Qu porcentaje de empleados trabaja por sobre este
tiempo?.
c) Determine el sueldo mediano de los empleados e interprete.
d) Determine el sueldo promedio para los empleados que laboran
menos de 44 horas semanales.
e) Cuntos empleados ganan ms de $430000 mensuales?.
f) Qu porcentaje de empleados ganan ms de $600000 y trabajan
ms de 44 horas semanales?.
g) Cuntas horas trabajan como mximo el 25% de los empleados que
laboran menos?.
h) En qu grado estn asociadas estas variables e interprete?.
i) Si el nmero de horas laborales disminuyera en un 10% Cul sera el
nuevo promedio de horas?.
j) Si desea aumentar el sueldo a los empleados que ganan menos de
$700000, en un 6% Cul sera la nueva desviacin estndar de esta
variable?.
2. Los pesos semanales de las personas que visitan una clnica que atiende a
personas con problemas cardacos principalmente; separados por mujeres y
hombres son los siguientes:
Responda:
a) Est usted de acuerdo en que el peso modal de hombres, es el mismo
que el de las mujeres.
b) Calcule el peso medio del total de personas.
Prof: Natalia Henrquez
X \ Y 36 a 40 40 a 44 44 a 48
300 a
500
5 3 4
500 a
700
2 2 6
700 a
900
0 7 8
Pesos Semanales
(kg)
Mujeres Hombres
60-65 15 5
65-70 19 25
70-75 25 28
75-80 21 20
80-85 20 22
Totales 100 100
42
Prof: Natalia Henrquez
c) Qu porcentaje de mujeres pesan menos de 83 kg
aproximadamente.
.3. En una empresa se han estudiado, los sueldos de los operarios y el
nmero de cursos de perfeccionamiento que estos han realizado.
Los datos de este estudio se entregan en el siguiente cuadro:
Sueldos en miles de
$
Nmero de Cursos
1 a 3 3 a 5 5 a 7
100 a 300
300 a 500
500 a 700
700 a 900
10
6
3
1
9
6
4
5
2
3
9
5
a) Determine el sueldo medio de los operarios y el nmero medio de
cursos de
perfeccionamiento que han realizado estos operarios.
b)Qu porcentaje de operarios gana como mnimo $500.000?
c) Qu porcentaje de operarios haya realizado menos de 5 cursos de
perfeccionamiento y reciba un sueldo no superior a $300.000?
d)Si un operario gana mnimo $300 mil, pero menos de $700 mil. Con
qu
porcentaje ha realizado como mnimo 5 cursos?.
CORRELACIN
Prof: Natalia Henrquez 43
Prof: Natalia Henrquez
Medidas de Asociacin
Objetivo: Determinar asociacin entre variables.
1. Coeficiente de Correlacin de Pearson ( r
xy
).

Un indicador estadstico llamado Coeficiente de Correlacin Lineal de Pearson,
permite cuantificar el grado de asociacin o relacin lineal entre tales
variables.
y x
xy
xy
Cov
r

el coeficiente de correlacin est acotado entre dos


valores que son 1 y 1, es decir se cumple:
1 1
xy
r
.
Cuando los valores son cercanos a 1, estamos frente a una alta
asociacin lineal inversa entre las variables.
Cuando los valores son cercanos a 1, estamos frente a una alta
asociacin directa entre las variables. Si es cercana a 0 diremos que
las variables son independientes o de existir una relacin esta no
sera lineal.
Si la asociacin es directa significa que a medida que aumenta una
la otra tambin aumenta, y si es inversa a medida que una disminuye
la otra aumenta.
En el ejemplo dado anteriormente el coeficiente de Pearson es:


159 . 0
33282 . 8
1325
135 . 1 177 . 61
325 . 1

xy
r
, tambin es posible calcular
el coeficiente entre dos variables presentadas en forma de columnas
ambas variables, es decir:
Tiempo ( min) Edad ( aos )
125 45
.
.
.
.
.
.
170 22
2 .Concepto de Rango :
Hasta el momento hemos hablado de los posibles valores numricos que
pueden tomar las variables, sin embargo, a estos es posible atribuirles una
ubicacin u orden, llamado Rango. Por ejemplo: Supongamos que se tienen los
siguientes nmeros: 4,3,9,5,14 y 12.
Al ordenarlos, estos ocupan una posicin que puede ser asociada al
concepto de rango. En el ejemplo se tendr que:
Prof: Natalia Henrquez 44
Prof: Natalia Henrquez
Es as
entonces, que al nmero 3, le asociamos el rango 1. Al nmero 4 y 5, los
rangos 2 y 3 respectivamente. Etc.
La determinacin de los rangos es sencilla si se tienen valores nicos no
repetidos, sin embargo, cuando si los hay, es decir, cuando se generan
Empates, entonces la manera de determinar los rangos ser la siguiente:
Primero se ordenarn los nmeros de menor a mayor y luego, se asignarn los
rangos respectivos pero, para los nmeros que presentan empates, el rango
que le corresponder finalmente ser la media de sus rangos asignados
inicialmente.
Veamos con un ejemplo esta situacin:
Supongamos que tenemos los nmeros 5,3,2,3,7,8,8,3,12 y 18.
Entonces al ordenar y al asignar los rangos respectivos se tendr la siguiente
tabla:
Se
observa que
el nmero 3 aparece repetido tambin tres veces y los respectivos rangos
iniciales, (*), son: 2,3 y 4. Por lo tanto, el rango asociado a cada uno de estos
nmeros ser:
3
3
4 3 2
empatados de Rango
+ +

El nmero 8, tambin aparece empatado y con sus respectivos rangos


iniciales, (**).
Procediendo de igual manera se tendr que:
5 . 7
2
8 7
empatados de Rango
+

Finalmente tendremos la siguiente y definitiva asignacin de rangos


para los nmros citados:
Nmer
o
2 3 3 3 5 7 8 8 12 18
Rango 1 3 3 3 5 6 7.5 7.5 9 10
Coeficiente de Correlacin de Rango de Spearman (r
s
).
Este coeficiente de correlacin, es la contraparte no paramtrica del
coeficiente de correlacin convencional, de Pearson. Se basa en la utilizacin
de los rangos asignados a los respectivos valores de las variables. Su
estructura es la siguiente:
Prof: Natalia Henrquez
Nmer
o
3 4 5 9 12 14
Rango 1 2 3 4 5 6
Nmer
o
2 3 3 3 5 7 8 8 12 18
Rango 1 2
*
3* 4* 5 6 7** 8** 9 10
45
Prof: Natalia Henrquez
) 1 (
6
1
2
1
2

n n
r
n
i
i
s
d
donde
i i i
y de Rango x de Rango d
Apliquemos este coeficiente de correlacin a los siguientes datos:
Tiempo en minutos
(X)
Edad en Aos
(Y)
125 45
90 38
130 37
145 23
165 19
170 22
Asignemos los rangos y las diferencias respectivas a estos valores en
ambas variables:
Al evaluar en la expresin
correspondiente r
s
, se tendr:
8871 . 0
) 1 6 ( 6
66 6
1
2


s
r
Este resultado indicara que existe alta
asociacin inversa entre ambas variables.
Correlacin Punto Biserial ( r
ps
)
Este coeficiente, es muy til cuando se desea establecer la relacin
existente entre una variable dicotmica ( Nominal ) y otra variable expresada
en forma cuantitativa.
La expresin que la rige es la siguiente:
) 1 (

) (

n n
n n x x
r
B A
Total
B A
pb

Donde:
A
x = Promedio de la variable cuantitativa en el grupo A.

B
x = Promedio de la variable cuantitativa en el grupo B.

Total

= Desviacin de la variable cuantitativa total ( incluye a ambos


grupos)
n= total de individuos ( los dos grupos ).
Prof: Natalia Henrquez
X
i
Y
i
d
i
d
i
2
2 6 -4 16
1 5 -4 16
3 4 -1 1
4 3 1 1
5 1 4 16
6 2 4 16
46
Prof: Natalia Henrquez
Ejemplo: Se desea establecer la relacin que existe entre el puntaje que
obtienen algunos alumnos, cuando estos han estudiado y cuando no lo han
hecho. Para esto, se realiza una tabulacin con la informacin disponible, que
se muestra a continuacin:
Alumn
o
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Estudi

si si si si si si si si no no no no no no no no
Puntaj
e
16 16 24 17 19 20 15 23 15 12 10 14 13 20 12 16
En este caso, se est frente a una variable que es nominal,
( dicotmica ), que genera dos grupos de alumnos, aquellos que estudian y los
que no lo hacen; y otra variable de orden numrico, que corresponde al
puntaje de cada uno de estos alumnos. Siendo as, al quererse obtener un nivel
de asociacin entre estas variables, lo adecuado es utilizar el coeficiente de
correlacin Punto Biserial.
Calculando los puntajes promedios para cada uno de estos estratos, y la
desviacin estndar del total de los alumnos se obtiene:
84 . 3 14 ; 75 . 18
Total B A
y x x , donde el subndice A representa los
puntajes de los alumnos que estudiaron y el subndice B representa los
puntajes de los alumnos que no lo hicieron. Reemplazando estos valores en la
frmula, se tiene:
64 . 0
) 1 16 ( 16
8 8

84 . 3
) 14 75 . 18 (

pb pb
r r
Se observa en este valor, una correlacin positiva, entre estudiar y
obtener un mejor puntaje.
Coeficiente FI ( )
Este coeficiente, nos permite asociar dos variables del tipo nominal
( dicotmicas ), siendo muy til su interpretacin ya que el objetivo es
establecer la relacin que tiene dos variables en presencia de sus atributos
dicotmicos.
En el panorama anterior, el inters ser establecer la relacin que se
presenta entre los atributos de ambas variables.
Los datos deben estar dispuestos en una tabla de doble entrada,
indicndose los atributos detalladamente y las respectivas frecuencias, como
se muestra a continuacin.
Prof: Natalia Henrquez
Variable 2
Atributo
1
Atributo 2
Variable 1 Atributo 1 a b
Atributo 2 c d
47
Prof: Natalia Henrquez
A partir de esta composicin, podemos definir el coeficiente FI, como:
=
z y x w
c b d a


donde w=a+c, x= b+d, y= a+b, z=c+d.
( generalmente el atributo 1 es con presencia de cierta caracterstica )
Ejemplo: Se desea establecer la relacin que existe entre el sexo de
participantes a un curso de lenguaje, con el problema que estos presentan en
el entendimiento de dicho lenguaje. Para lo anterior, se tabulan los
antecedentes disponibles, indicando la cantidad de ellos que se presentan en
cada caso:
Con problemas
de
entendimiento
Sin problemas de
entendimiento
Damas 2 12
Varones 4 7
En este caso el valor de FI es: =
26 . 0
17556
34
11 14 19 6
12 4 7 2


Cuando el resultado es negativo FI se interpreta, como la asociacin entre
el primer atributo de la variable 1 con el segundo atributo de la variable 2, o el
segundo atributo de la variable 1 con el primero de la variable 2. Si da positivo,
se tiene que hay asociacin entre la primera de la variable 1 con la primera de
la variable 2, o la segunda de la variable 1 con la segunda de la variable 2. En
el ejemplo se concluye que las damas que participaron en el curso de lenguaje
se asocian con el atributo de sin problemas de entendimientos y los varones se
asocian con problemas de entendimiento.
Ejercicio
En un jardn infantil, se ha observado a dos grupos de nios que fueron
alimentados con distintos tipos de cereal, an grupo se les aliment con cereal
normal y a otro con cereal con vitaminas adicionales. Luego se apreciaron la
cantidad de ellos que presentaron resfros reiterados. Los antecedentes son los
siguientes:
Con
resfros
Sin
Resfros
Alimentado con 23 40
Prof: Natalia Henrquez 48
Prof: Natalia Henrquez
cereal normal
Alimentado con
cereal con
vitaminas
15 20
Determine si existe alguna relacin entre resfriarse o no, y haber sido
alimentado con un cereal normal o con vitaminas.

Prof: Natalia Henrquez 49
Probabilidad
Prof: Natalia Henrquez
PROBABILIDAD CLSICA
INTRODUCCIN
El clculo de probabilidades tiene su origen en la poca pos renacentista,
nace del estudio de los juegos de azar, del deseo de poder cuantificar las
posibilidades de ganar o perder que se tienen ante una mano de naipes, el
lanzamiento de un dado o lanzar una moneda al aire. Sin embargo este inters
ldico inicial trascendi en la historia del pensamiento, pues un anlisis ms
fino de cualquier situacin real nos lleva a considerar una porcin de azar
( imponderables) que est presente en la misma. Tanto es as que de lo nico
que tenemos seguridad es de nuestra muerte biolgica, la mayora de las
veces cuando decimos que algo ser seguro en realidad estamos diciendo
que es altamente probable que ocurra.
Al estudiar la realidad podemos distinguir dos tipos de experimentos, los
determinsticos y los probabilsticos:
Los experimentos determinsticos son aquellos que tienen slo un resultado
posible adems este es predecible. Por ejemplo: si el experimento consiste en
soltar una piedra desde lo alto de un edificio y observar el sentido del
movimiento, el resultado nico posible es que la piedra caiga en posicin
vertical hacia el suelo.
Los experimentos probabilsticos son aquellos que tienen ms de un resultado
posible y cada resultado no es predecible. Por ejemplo: lanzar una moneda al
aire y observar que lado muestra despus de caer. Notemos que si bien
sabemos de antemano que la moneda puede mostrar cara o sello, no
podemos predecir que saldr y el resultado lo conoceremos slo despus de
que la moneda haya finalizado su movimiento.
Prof: Natalia Henrquez 50
Prof: Natalia Henrquez
Dado un experimento cualquiera, que de notaremos por E, llamado
ESPACIO MUESTRAL, denotado por , al conjunto de todos los posibles
resultados de E. Como ejemplo tenemos:
a)E= Se lanza una moneda al aire
} , { sello cara
b)E=Se lanza un dado
} 6 , 5 , 4 , 3 , 2 , 1 {
c)E= Sexo de una persona
} , { femenino masculino
d) E= Pinta de la carta en un mazo ingls
} , , , { diamante pica corazn trebol
Se llama suceso o evento a cualquier subconjunto de , los sucesos
se denotan por letras maysculas. El hecho que A sea un suceso de , lo
denotamos por A . Observamos inmediatamente que el conjunto

es un
suceso,

y le llamamos suceso vaco o suceso imposible.
Si jugamos cara y sello y previamente se nos pregunta por la
probabilidad de sacar cara, seguramente que es de 50%, pues hay slo
dos posibles resultados, pero adems hemos supuesto que la posibilidad de
obtener cara es idntica a la de obtener sello, este concepto se
denomina
EQUIPROBABILIDAD.En lenguaje tcnico diremos que los resultados cara
y sello son equiprobables, obviamente si es que la moneda que se lanza no
est cargada.
Se llama medida de un conjunto a algn nmero que nos indique el
tamao del conjunto, la medida del conjunto A se denota por m(A). Si el
conjunto es finito y se pueden contar sus elementos, la medida natural que
aparece es m(A)= nmero de elementos del conjunto. Por ejemplo si
} 6 , 5 , 4 , 3 , 2 , 1 {
entonces m( ) = 6.
Si el conjunto es un intervalo de la recta real o una porcin del plano
cartesiano puede considerarse como m(A)= longitud del intervalo o m(A)=
rea de la porcin del plano cartesiano segn sea el caso.

ALGUNAS DEFINICIONES PARA CONTAR
PRINCIPIO FUNDAMENTAL DEL CONTEO
Si algn suceso puede ocurrir de
1
n maneras diferentes, y siguiendo este
suceso, un segundo suceso puede ocurrir de
2
n maneras diferentes y as
sucesivamente entonces el nmero de maneras en que los sucesos puedan
ocurrir est dado por
k
n n n ...
2 1
.
Ej. Supongamos que una placa de automvil contiene dos letras seguidas
de tres dgitos con el primer dgito diferente de cero.Cuntas placas diferentes
pueden fabricarse?
656100 10 10 9 27 27 placas diferentes pueden fabricar.
PERMUTACIONES
Prof: Natalia Henrquez 51
Prof: Natalia Henrquez
Cualquier arreglo de un conjunto de n objetos en un orden dado se llama
permutacin de los objetos (tomados todos al mismo tiempo). Cualquier
arreglo de cualquier n r de estos objetos en un orden dado se llama r-
permutacin o arreglo de n objetos tomados de a r al mismo tiempo.
El nmero de permutaciones de n objetos es ! n ( nmero factorial)
El nmero de permutaciones de r objetos tomados de n objetos totales es
)! (
! !
r n
n

( los n objetos son distintos)


PERMUTACIONES CON REPETICIONES
El nmero de permutaciones de n objetos de los cuales hay
1
n iguales,
2
n
iguales, ...,
r
n iguales es:
! ... ! !
!
2 1 r
n n n
n

MUESTRAS ORDENADAS
Muestreo con recolocacin de r intentos es :
n n n
... = r veces =
r
n
Muestreo sin recolocacin de r intentos es :
)! (
!
r n
n


COMBINACIONES
Supongamos que tenemos una coleccin de n objetos. Una combinacin
de estos n objetos tomados de r a la vez es cualquier seleccin de r de los
objetos , donde el orden no se tiene en cuenta y se calcula.

,
_

r
n
C
n
r
( nmero combinatorio )
COMBINATORIA
1.- (i) Cuntas placas de automviles pueden fabricarse si cada placa
contiene 2
letras diferentes, seguidas de 3 dgitos diferentes.
Prof: Natalia Henrquez 52
Prof: Natalia Henrquez
(ii) Resolver el problema, si el primer dgito no puede ser 0
2.- Cuntos nmeros enteros y positivos, menores que 500, se pueden
formar con los
dgitos (diferentes)?
3.- (i) Encontrar el nmero de maneras en las cuales cinco personas pueden
sentarse
en una fila De cuntas maneras, si dos de las personas insisten en
sentarse
juntas?
4.- En una reunin hay 4 mujeres y 3 hombres. De cuntas maneras
podemos sentar a estas 7 personas, si los hombres siempre deben estar
juntos?
5.- Hay 6 carreteras entre A y B y 4 carreteras entre B y C
a)De cuntas maneras se puede viajar de A a C pasando por B?
b)De cuntas maneras se puede hacer el viaje de ida y vuelta de A a C
pasando por B?
c)De cuntas maneras se puede hacer el viaje de A a C ida y vuelta sin
usar la misma carretera ms de una vez?
6.- a) Encontrar el nmero de maneras en las cuales 4 nios y 4 nias
pueden sentarse en una fila si los nios y las nias deben ocupar sillas
alternadas.
b)Encontrar el nmero de maneras si se sientan de manera alternada y
si un nio y una nia deben ocupar asientos adyacentes.
c)Encontrar el nmero de maneras si se sientan en forma alternada y si
un nio y una nia no deben sentarse en puestos adyacentes.
7.- Considerar todos los enteros positivos con 3 dgitos diferentes
a)Cuntos son mayores que 700?
b)Cuntos son divisibles por 5?
8.- Cuntos palabras distintas podemos formar con las letras de la palabra
PARALELEPIPEDO?
9.- Encontrar n si
a)P (n,2)=20 b)P (n,3)=720 c)P(n,3) = 7P(n,2)
10.- Una clase tiene 9 nios y 3 nias
a)De cuntas maneras puede el maestro escoger un comit de 4?
Prof: Natalia Henrquez 53
Prof: Natalia Henrquez
b)Cuntos de estos tendrn por lo menos una nia?
c)Cuntos de estos tendrn exactamente una nia?
11.- Una seora tiene 11 amigos y amigas cercanos
a)De cuntas maneras puede invitar a 5 de ellos a cenar?
b) De cuntas maneras si dos de ellos estn casados y no van a asistir
separadamente?
12.- Del ejercicio anterior supongamos que 6 son mujeres
a) De cuntas maneras puede ella invitar 3 ms de sus amigas a una
fiesta?
b) De cuntas maneras puede ella invitar 3 ms de ellos, si desea
que asista al
mismo nmero de hombres que de mujeres (incluyndose ella)?
13.- Hay 10 puntos A,B,, en un plano, no estando tres en la misma lnea.
a)Cuntas lneas pueden determinarse por los puntos?
b)Cuntas de esas lneas no pasarn por A o B?
c)Cuntos s se determinan por los puntos?
d)Cuntos de esos s contienen el punto A?
e)Cuntos de esos s contienen el lado AB?
14.- Un estudiante debe responder 10 de 13 preguntas en un examen
a) Cuntas selecciones tiene?
b) Cuntas si debe responder a las dos primeras preguntas?
c) Cuntas si debe responder a la 1era. o a la 2da pregunta, pero no
ambas.
d) Cuntas si debe responder exactamente 3 de las 5 primeras preguntas?
e) Cuntas si debe responder, por lo menos, 3 de las 5 primeras
preguntas?
15.- Existe un alfabeto con 26 letras, de las cuales 5 son vocales
a) Cuntas palabras se pueden formar de 5 letras que contengan 3
consonantes diferentes y 2 vocales diferentes?
b) Cuntas de ellas contienen la letra b?
c) cuntas de ellas comienzan con b y terminan con c?
16.- De cuntas maneras pueden repartirse 9 juguetes de manera equitativa
entre 3 nios?
17.- Se dispone de 15 libros, uno de los cules es la Biblia y el otro es Mara
a)De cuntas maneras puede hacerse una seleccin de 12 de estos
libros?
b)De modo que la Biblia est necesariamente incluida?
c)Tal que Mara sea excluida?.
Prof: Natalia Henrquez 54
Prof: Natalia Henrquez
18.- Un hombre tiene tiempo para jugar ruleta cinco veces gana o pierde un
peso en cada jugada. Comienza con dos pesos y va a retirarse antes de la
quinta vez, si pierde todo su dinero o gana tres pesos ( es decir, tiene cinco
pesos). Encontrar el nmero de maneras en que puede desarrollarse el juego
(use el mtodo del rbol)
19.- En una fiesta hay 4 mujeres y 3 hombres. Si quiero formar grupos de 4
personas.
De cuntas maneras lo puedo hacer, si quiero que est un hombre
determinado y que no est una mujer determinada?
TERCERA PARTE
20.- 20 personas reunidas en una fiesta escriben en un da de cumpleaos en
una hoja
de papel.
a)Sin importar el orden en que aparece el listado de las 20 fechas de
cumpleaos.
Cuntas son las listas posibles?
b)De todas las listas posibles, De cuales hay ms, aquellas que se
repite alguna
fecha o aquellas en que todas las fechas son distintas?.
21.-De cuntas maneras se pueden ordenar Juan, Pedro, Francisca y Natalia
para una foto si Pedro y Cecilia deben estar siempre juntos?.
22.-De cuntas maneras puede dividirse un conjunto de 9 mujeres en 3
grupos de 2, 3 y
4 mujeres para habitar las piezas roja, azul y verde respectivamente?.
23.- De cuntas formas puede elegirse a 2 hombres y 2 mujeres para un
debate si hay 5
hombres mujeres posibles?.
24.- De cuntas maneras puede una cliente elegir 6 de 18 vestidos?.
25.- De cuntas formas se puede ordenar 11 videos diferentes sobre un
estante de
exposicin?.
De cuntas formas puede ordenar 11 videos sobre un estante de
exposicin si
una pelcula se repite 3 veces y otra 2 veces?.
26.- De cuntas formas puede contestarse un cuestionario con 12 preguntas
de tipo
verdadero y falso?.
27.- Cuntos nmeros pares de 4 dgitos hay que utilizan los dgitos 7,6,4 y
2 ?.

Prof: Natalia Henrquez 55
Prof: Natalia Henrquez
28.- a) Se lanza un dado dos veces consecutivas. Cules y cuntos son los
posibles
nmeros que aparecen?. Haga un listado.
b)Se lanza dos dados simultneamente. Cules y cuntos son los posibles
nmeros
que aparecen ? Haga una lista.
29.- Luis y Mara trabajarn en el verano en dos trabajos distintos elegidos de
una lista de
8.Cuntas son las combinaciones?.
30.- Cuntas palabras puede formarse con las letras de la palabra N U M E
R O?
31.- Cuntas palabras puede formarse con las letras de la palabra A B R I
L?
32.- Cuntas palabras puede formarse con las letras de la palabra M O C O
S O?
33.- Cuntas palabras puede formarse con las letras de la palabra B O R O
R O?
34.- a)Cuntos comits de 7 personas se pueden formar de un grupo de 24
personas?
b)De cuntas maneras se puede elegir 7 personas de 24 para ocupar 7
trabajos
distintos?
c)De cuntas maneras se puede elegir 7 personas de 24 para ocupar 2
trabajos
distintos, uno de 3 personas y el otro de 4 ?
35.- Una pizzera tiene 2 tipos de masas para sus pizzas y tiene 7 ingredientes
posibles, uno de ellos queso. Si todas las pizzas tienen queso Cuntos tipos de
pizzas puede ofrecer la pizzera, si todas llevan 3 ingredientes?
36.- Pruebe las siguientes afirmaciones.
a)P(n,n-1) = P(n,n), b)P(n,2)+P(n,3) = (n-1)P(n,2)
37.-Resuelva las siguientes ecuaciones:
a)P(n,2)= 72 b) P(n-1,5) = 3 P(n,4) c) P(n,3) = 210
38.- Para todo entero positivo n se tiene que
Prof: Natalia Henrquez 56
Prof: Natalia Henrquez

n
k
n
n
k k
n
k
k

,
_

1
!
Verifique esto por calculo directo para n=3 y n=4.
39.- Pruebe:

,
_

,
_

,
_

,
_

5
8
2
1 0
2
7
7
1 0
Prof: Natalia Henrquez 57
Prof: Natalia Henrquez
40.- De cuntas maneras puede un equipo de ftbol ganar 7 partidos, perder
2 y empatar otros 2, si va a jugar 11 partidos?
41.- Cuntos enteros entre 1000 y 9000 puede formarse con los dgitos
2,4,5,6 y 7?

DEFINICIN CLSICA DE PROBABILIDAD, PROBABILIDAD DE LA UNIN,
SUCESOS EXCLUYENTES, PROBABILIDAD CONDICIONAL, PROBABILIDAD TOTAL
Y FMULA DE BAYES.

a) Interpretacin de Probabilidad clsica:
Se define la probabilidad de que un evento ocurra como:
Nmero de resultados en los que se presenta el evento / nmero total de
resultados posibles.

La probabilidad clsica, es argumentada por el principio de razn y
suficiencia que establece que cada resultado elemental es equiprobable
(simtrico). Si utilizamos objetos como monedas no alteradas, dados no
cargados y mazos de barajas normales, entonces sin necesidad de lanzar una
moneda, un dado o tomar una carta, podemos evaluar las probabilidades.
La probabilidad clsica supone tambin una especie de construccin de
simetra en el mundo, no obstante existen situaciones en las cuales sta no
est presente o no se da la equiprobabilidad.
Ejemplo 1: La probabilidad que llueva un da de julio en Santiago, es mayor
que la probabilidad que no llueva.
Ejemplo 2: Supongamos que tenemos una urna con 20 pelotas de las cuales
18 son rojas y 2 verdes.
a) Cul es la probabilidad de elegir una pelota verde en el primer
intento?
b) Cul es la probabilidad de elegir una pelota roja en el primer
intento?
Prof: Natalia Henrquez 58
10%
10
1
20
2
18 2
2
P(V)
+

90%
10
9
20
18
18 2
18
P(R)
+

Prof: Natalia Henrquez


Todos estos clculos se desarrollan sin realizar experimento alguno, que es la
aplicacin directa de la definicin de Laplace".
b) Interpretacin de Probabilidad frecuentista:
Corresponde a la frecuencia relativa o fraccin de veces que se observa
de un evento durante un gran nmero de intentos que se repiten en idnticas
condiciones.
Este mtodo utiliza la frecuencia relativa de las observaciones pasadas
de un evento como una probabilidad. Determinamos qu tan frecuente ha
sucedido algo en el pasado y usamos esa cifra para aproximar la probabilidad
de que suceda de nuevo en el futuro.
Cuando utilizamos el planteamiento de frecuencia relativa para
establecer probabilidades, el nmero que obtenemos como probabilidad
adquirir mayor precisin a medida que aumentan las observaciones.
" La probabilidad de un suceso es el lmite al que converge la proporcin de
repeticiones en que el suceso tiene lugar ".
Ejemplos:
1. Consideremos el lanzamiento de 1 moneda en 10 ocasiones, si se obtuvo 8
CARAS y 2 SELLOS. Cul es la probabilidad en cada caso?
La probabilidad es de 8/10 y 2/10 respectivamente.
2. Se lanza un dado 18000 veces; se obtienen los resultados resumidos en la
siguiente tabla, agrupados de acuerdo al nmero de tiradas.

RESULTADOS POSIBLES DEL DADO
N de
tiradas
1 2 3 4 5 6
20 5 4 2 4 2 3
60 7 6 6 11 9 21
300 47 39 44 56 42 72
600 89 84 82 111 104 130
1200 174 166 185 203 207 265
2400 362 345 387 396 407 503
6000 946 885 1002 993 941 1233
18000 2911 2851 2833 2766 2806 3833
Calcule las probabilidades frecuentistas para la primera, cuarta y novena fila
para cada uno de los resultados del dado. Qu deduccin se puede plantear a
Prof: Natalia Henrquez 59
Prof: Natalia Henrquez
partir del anlisis de estos resultados?, Se tienden a estabilizar estas
probabilidades a medida que el nmero de lanzamientos crece?. La ley que
avala esta tendencia, se denomina "Ley de los grandes nmeros".
c) Interpretacin Subjetiva de Probabilidad.
Las probabilidades subjetivas estn basadas en las creencias de las
personas que efectan la estimacin de probabilidad. La probabilidad subjetiva
se puede definir como la probabilidad asignada a un evento por parte de un
individuo, basada en la evidencia que se tenga disponible. Esa evidencia puede
presentarse en forma de frecuencia relativa de presentacin de eventos
pasados o puede tratarse simplemente de una creencia meditada.
Las valoraciones subjetivas de la probabilidad permiten una ms amplia
flexibilidad que los otros dos planteamientos. Los tomadores de decisiones
puede hacer uso de cualquier evidencia que tengan a mano y mezclarlas con
los sentimientos personales sobre la situacin.
Las asignaciones de probabilidad subjetiva se dan con ms frecuencia cuando
los eventos se presentan slo una vez o un nmero muy reducido de veces.
Como casi todas las decisiones sociales y administrativas de alto nivel se
refieren a situaciones especficas y nicas, los responsables de tomar
decisiones hacen un uso considerable de la probabilidad subjetiva.
Ejemplos:
Tomemos como ejemplo, la manera de razonar, actuar y
decidir de un juez con relacin a un delito. En este caso, los jueces en base a la
informacin que aparece en los expedientes, la cual conforma la base de
evidencias, emiten un juicio de valor (presumiblemente culpable o inocente). Si
el juez considera que hay suficientes pruebas que sealan la probable
culpabilidad de una persona; entonces proceden a dictar un auto de detencin
al denominado en estos casos, el indicado; ya que hay indicio de culpabilidad
del mismo. Ello da pi al inicio de un proceso el cual es el juicio. Toda esta fase
aqu descrita, es anloga al inicio de un ejercicio de pronstico usando el
modelo bayesiano como tcnica del proceso. El primer paso en tales ejercicios
de pronsticos, ser asignar (a priori) las probabilidades iniciales P(Hi) a cada
una de las hiptesis consideradas; tomando como base la informacin que se
tenga disponible para ese momento. De igual manera, el juez (en caso de
haber encontrado suficientes indicios de culpabilidad) formula, aunque no lo
hace, formalmente dos hiptesis:
HIPTESIS 1: CULPABLE
HIPTESIS 2: INOCENTE
Si l considera que hay suficientes indicios de culpabilidad entonces,
considera la probabilidad de que sea cierta la hiptesis 1: culpable, muy alta.
Por ejemplo:
Prof: Natalia Henrquez 60
Prof: Natalia Henrquez
HIPTESIS 1: CULPABLE P(H1) = 0.90
HIPTESIS 2: INOCENTE P(H2) = 0.10
Estas probabilidades varan en base a las evidencias observadas y
mostradas durante el juicio: o bien para hacer que aumente P(H1) o bien para
disminuir P(H1) y aumente P(H2). As, una persona que pareca ser culpable en
base a la informacin inicial (juicios, a priori) puede resultar inocente durante
la ejecucin del juicio, como consecuencias de las evidencias dadas como
pruebas de la parte defensora; para as generar las bases de un juicio de valor
( a posteriori) favorable.
De sta manera la lgica que opera en la mente de quienes tiene en sus
manos la administracin de la justicia es completamente anloga a la lgica
que debe gobernar los ejercicios de pronstico basados en la tcnica de los
modelos bayesianos. Por ello, una vez establecidas las probabilidades iniciales
P(Hi) para cada hiptesis; las mismas se irn modificando progresivamente
segn las evidencias observadas. Tales probabilidades, que consideran las
evidencias ocurridas son las llamadas probabilidades revisadas o a posteriori,
las cuales se calculan o estiman con la frmula:
P(H1|H2) = [P(H2|H1)/P(H2)] * P(H1),
Ejemplo:
Cul es la probabilidad de que el prximo ao haya una recesin econmica?
o
Cul es la probabilidad de que haya guerra en CHILE el prximo ao? o
Cul es la probabilidad que pase de curso? o
Cul es la probabilidad de obtener promedio siete en matemtica final ? o
Cul es la probabilidad de obtener promedio sobre seis en matemtica ?
De cualquiera de stas interpretaciones de Probabilidad aparecen dos
resultados fundamentales:
1)
0 ) ( p
, la probabilidad del suceso imposible es nula.
2)
1 ) ( p
, la probabilidad del espacio muestral es 1.
Dos sucesos A y B se dicen excluyentes, si es IMPOSIBLE que ocurran juntos a
la vez, en smbolos
B A
. Por ejemplo se lanza un dado y sea A= salga
par , B= salga impar, el suceso que salga par e impar a la vez es

.
AXIOMAS DE PROBABILIDAD
1)
1 ) ( 0 A p
2) Si
B A
entonces
) ( ) ( ) ( B p A p AUB p +
.
Prof: Natalia Henrquez 61
Prof: Natalia Henrquez
Para enfrentar un problema de clculo de probabilidades, se debe poner
especial cuidado en definir los sucesos de inters. Ejemplifiquemos con algunas
situaciones elementales del experimento lanzar un dado:
E= Se lanza un dado
} 6 , 5 , 4 , 3 , 2 , 1 {
Definamos los sucesos siguientes y calculemos sus probabilidades de
ocurrencia:
1) A: el dado muestra as , as A={1} Y m(A)=1, con lo que
6
1
) ( A p
2) B: El dado muestra un nmero impar , as B={1,3,5} y m(B)=3, con
lo que

2
1
6
3
) ( B p
Sin embargo, la realidad presenta sucesos compuestos, los que se forman
unindolos, intersectndolos y complementndolos. Efectuemos estas
composiciones y estudiemos su significado, en consecuencia: dados los
sucesos A y B se tiene:
1) : B A sucede A y B a la vez.
2) : B A sucede A o B , as
) ( ) ( ) ( ) ( B A p B p A p B A p +
3) :
c
A no sucede A, as ) ( 1 ) ( A p A p
c
.
Decimos de los sucesos A y B son INDEPENDIENTES, si la ocurrencia de uno
de ellos no altera la ocurrencia del otro, la hiptesis de independencia se
expresa as :
) ( ) ( ) ( B p A p B A p
.
En resumen:
EJEMPLOS DE EVENTOS SEGUROS E IMPOSIBLES
S= SEGURO, I= IMPOSIBLE.
1. Que el agua se congele 0F. (S)
2. Que un hombre quede embarazado naturalmente. (I)
3. Que una hormiga levante un camin. (I)
4. Que las personas mueran. (S)
5. Lanzar una pelota y que caiga en el cielo. (I)
6. Que un sordo mudo recite las notas musicales en forma natural. (I)
7. Prender un cigarro bajo el agua. (I)
8. Que las personas en su vida no tomen agua. (I)
9. Que los perros hablen. (I)
10.Pestaear al menos una vez al da. (S)
Utilizando propiedades de conjuntos podemos enunciar:
1. P( )= 0.
2. P(S) = 1.
Prof: Natalia Henrquez 62
Prof: Natalia Henrquez
3.
1 P(A) 0
, para todo evento que sea subconjunto del espacio muestral.
4. P(AUA
c
)=P(S)=1
5. P( A U B)= P(A)+P(B) - P(AB)
6. P( A B) = P(A)- P(AB)
7. Si entre dos eventos no hay elementos comunes, es decir AB = se
tiene
P( A U B)= P(A)+P(B),
en este caso se dir que los eventos son excluyentes.
8. P(A
c
)=1- P( A).
Resumen de los tres tipos de probabilidades

La probabilidad CLSICA est
basada en el juego. La suposicin
fundamental es que el juego es
justo y que todos los resultados
elementales tienen la misma
probabilidad.
La probabilidad FRECUENTISTA:
cuando un experimento se puede
repetir. La probabilidad de un
resultado es la proporcin de
ocasiones en las que aparece a
largo plazo.
La probabilidad SUBJETIVA O
PERSONAL: la mayora de los
sucesos de la vida real son
irrepetibles. La probabilidad
subjetiva es la valoracin personal
que hace el individuo de las
posibilidades de obtener un
resultado.
Por ejemplo la probabilidad de que
cada alumno en un curso de
obtener promedio superior a 6.5 en
matemtica es distinta de acuerdo
a sus habilidades desarrolladas
( experiencia de por medio) hasta
el momento, aunque tericamente
debiera ser la misma para todos.
Un objetivista utiliza la definicin
clsica de probabilidad o la de la
frecuentista. Un subjetivista o
Bayesiano, aplica las leyes
formales del azar a sus
probabilidades personales
PROBABILIDAD CONDICIONAL E INDEPENDENCIA
PROBABILIDAD CONDICIONAL
Sea E un suceso arbitrario de un espacio muestral , con P(E)>0. La
probabilidad de que un suceso A suceda una vez que E ha ocurrido o, en otras
palabras, la probabilidad condicional de A dado E, escrito por:
P( A
) E
=
) (
) (
E P
E A P
Prof: Natalia Henrquez 63
Prof: Natalia Henrquez

En particular, si el conjunto es un espacio equiprobable tenemos:


E A
E A P ) (
,

E
E P ) (
,
.
) (
) (
) (
E
E A
E P
E A P
E A P

TEOREMA: Si A,E , entonces


) ( ) ( ) ( ) ( A P A E P E P E A P
Demostracin de tarea.
Ejemplos:
1. Se lanza un par de dados. Si la suma es 6, encontrar la probabilidad de
que uno de los nmeros sea un 2.
y encontrar la probabilidad de que por lo menos uno de los nmeros sea
un 2 sabiendo que la suma es 6
2. Un matrimonio tiene dos hijos. Encontrar la probabilidad de que ambos
sean varones si :
i) se sabe que uno de los hijos es un varn.
ii) Se sabe que el hijo mayor es un varn.
DEFINICIN:
Decimos que los sucesos
k
B B B B ,..., , ,
3 2 1
representa una particin
del espacio muestral si : a)
j i B B
j i

b)

i
k
i
B
1
c)
i B P
i
0 ) (


Ejemplo: En el lanzamiento de un dado } 2 , 1 {
1
B , } 5 , 4 , 3 {
2
B ,
} 6 {
3
B
representa una particin de . En cambio } 4 , 3 , 2 , 1 {
1
C y
} 6 , 5 , 4 {
2
C NO.
Prof: Natalia Henrquez 64
Prof: Natalia Henrquez
OBSERVACIN:
) ( ... ) ( ) ( ) (
3 2 1 k
B A B A B A B A A

) ( ... ) ( ) (
1 k
B A P B A P A P + +
) ( ) ( ... ) ( ) ( ) ( ) ( ) (
2 2 1 1 k k
B P B A P B P B A P B P B A P A P + + +


k
i
i i
B P B A P A P
1
) ( ) ( ) (
) (
) ( ) (
) (
A P
B P B A P
A B P
i i
i


EXPERIMENTO N1
Tenemos 2 bolsas, cada una con 10 bolas entre blancas , negras y rojas.
Bolsa 1 : 4B,2R,4N
Bolsa 2 : 1B,2N,7R
Tiramos un dado, si sale 1 2 extraemos una bola de la bolsa 1, si sale 3,4,5,6,
extraemos una bola de la bolsa 2. Ganamos si al final sale bola roja, si no
perdemos Qu es ms fcil, ganar o perder?.
Cul es la probabilidad de que la bola venga de la bolsa 1, sabiendo que
gan?.
EXPERIMENTO N2.
Tenemos 3 cajas:
La caja 1 contiene 10 ampolletas, de las cuales 4 estn defectuosas.
La caja 2 contiene 6 ampolletas, de las cuales 1 est defectuosa.
La caja 3 contiene 8 ampolletas, de las cuales 3 estn defectuosas.
Seleccionamos una caja al azar y luego sacamos una ampolleta al azar.Cul
es la probabilidad de que la ampolleta est defectuosa?.
Cul es la probabilidad de que la ampolleta extrada venga de la caja 1,
sabiendo que es defectuosa?.
EXPERIMENTO N3.
Una caja contiene 3 monedas, una de las monedas es corriente, otra moneda
tiene dos caras, y la tercera moneda est cargada de tal manera que la
probabilidad de obtener cara es 1/3. Encontrar la probabilidad de obtener
cara?.
EXPERIMENTO N4.
La urna A contiene 3 fichas rojas y 2 fichas blancas.
La urna B contiene 2 fichas rojas y 5 fichas blancas.
Se selecciona una de las urnas al azar ; se toma una ficha y se coloca en la
otra urna luego, se saca una ficha de la segunda urna. Encontrar la
probabilidad de que ambas fichas sacadas sean del mismo color.
Prof: Natalia Henrquez 65
Prof: Natalia Henrquez
EXPERIMENTO N5
Supngase que una oficina tiene 100 mquinas calculadoras, algunas de esas
mquinas son elctricas (E), mientras que otras son manuales ( M). Adems
algunas son nuevas (N), mientras las otras son usadas (U).


E M
N 40 30 70
U 20 10 30
60 40 100
CALCULAR:
? ) ( ? ) ( ? ) ( ? ) ( ? ) ( ? ) ( E N P N M P U P U E P N P N E P
EJEMPLO:
Supngase que muchas cajas estn llenas de caramelos de dos tipos ,
digamos A y B. El tipo A
Contiene 70% dulce y 30% cido, mientras que en el tipo B dichos
porcentajes son al revs, aun
ms, supngase que 60% de todas las cajas de caramelos son del tipo A
mientras que el resto son del tipo B.
Calcule : P(A), P(B), P( dulce/A), P(cido/A), P(dulce/B), P(cido/B).
INDEPENDENCIA
EJEMPLO:
Una moneda se lanza tres veces; se obtiene el espacio equiprobable:
} , , , , csc, , , { sss ssc scs scc css ccs ccc
.
Considere los sucesos: A={el primer lanzamiento resulta cara},
B={el segundo lanzamiento resulta cara}
C={exactamente dos caras resultan en dos lanzamientos
seguidos}
Determine que A y C son independientes y B y C son dependientes.
Prof: Natalia Henrquez 66
Prof: Natalia Henrquez
EJERCICIOS
1.- Qu funcin define un espacio de probabilidad en S= { a
1
,a
2
,a
3
}
i) P (a
1
) = 1/4 , P (a
2
) = 1/3 , P (a
3
) =1/2

ii) P (a
1
)=2/3 , P (a
2
) = - 1/3 , P (a
3
) = 2/3
iii) P (a
1
) =1/6 , P (a
2
) = 1/3 , P (a
3
) = 1/2
2.- Sea P una funcin de probabilidad en S= { a
1
,a
2
,a
3
}. Encontrar P (a
1
) si
i) P (a
2
) =1/3 y P (a
3
) =
4
1
ii) P (a
1
)= 2 P (a
2
) y P (a
3
)=
4
1
3.- Sean A y B sucesos con P (AB) = 7/8 , P (A B) = 1/4 , P (A
c
) =5/8
Encontrar P (A), P (B) y P (A B
c
).
4.- Una moneda est cargada de tal manera que la posibilidad de que
aparezcan caras es tres veces mayor que la posibilidad de que
aparezcan sellos.
Encontrar P (H) y P (T).
5.- Tres estudiantes A, B y C intervienen en una prueba de natacin. A y B
tienen la misma probabilidad de ganar y cada uno tiene el doble de la de
C.
Encontrar la probabilidad de que gane B o C.
6.- Un dado est cargado de tal manera que los nmeros pares tienen doble
posibilidad de aparecer que los nmeros impares. Encontrar la
probabilidad de
que.
(i) aparezca un nmero par
(ii) aparezca un nmero primo
(iii) aparezca un nmero impar
(iv) aparezca un nmero primo impar.
7.- En un campeonato de natacin, las posibilidades de que A gane son 2 a
3 y las de que B gane son 1 a 4. Encontrar la probabilidad P y las
posibilidades de que A o B ganen el campeonato.
Prof: Natalia Henrquez 67
Prof: Natalia Henrquez
8.- Una clase contiene 5 estudiantes de matemticas, 4 estudiantes de fsica, 8
estudiantes de qumica y 3 estudiantes de Biologa. Se escoge un
estudiante para representar la clase, encontrar la probabilidad de que el
estudiante sea.
i)un fsico (ii) un bilogo (iii) un Qumico o Bilogo.
9.- Se saca una tarjeta al azar de entre 50 tarjetas numeradas del 1 al 50.
Encontrar la probabilidad de que el nmero en la tarjeta sea.
i) divisible por 5 ii) primo iii) termine con el dgito 2
10.- En una clase de 10 nias hay 3 con ojos azules. Si se escogen dos nias al
azar,
Cul es la probabilidad de que:
i i) ambas tengan los ojos azules?
ii)ninguna tenga los ojos azules?
iii)por lo menos una tenga los ojos azules?
11.- Tres pernos y tres tuercas se colocan en una caja, si dos objetos se
escogen al azar, encontrar la probabilidad de que uno sea un perno y el
otro sea una tuerca.
12.- Diez estudiantes A, B, estn en una clase. Si se conforma un comit de
tres, escogidos al azar entre los miembros de la clase, encontrar la
probabilidad de que
i) A pertenezca al comit.
ii) B pertenezca al comit.
iii) A y B pertenezcan al comit.
13.- Una clase consta de 6 nias y 10 nios. Si se escogen 3 estudiantes al
azar para conformar un comit, encontrar la probabilidad de que
i i)se seleccionen 3 nios
ii)se seleccionen exactamente 2 nios
iii)se seleccionen, por lo menos, un nio
ii iv)se seleccionen exactamente 2 nias.
iii
Cuarta parte
1.- Se lanza un dado. Si el nmero es impar, Cul es la probabilidad de que
sea primo?
2.- Se escoge una letra al azar, de la palabra credos. Si es una consonante,
Cul es la probabilidad de que sea la primera letra de la palabra?
3.- Se lanza un par de dados. Si los nmeros que aparecen son diferentes,
encontrar,
la probabilidad de que su suma sea par.
Prof: Natalia Henrquez 68
Prof: Natalia Henrquez
4.- Un jugador recibe 3 cartas de picas de una baraja corriente de 52 cartas. Si
se le dan 4
cartas adicionales, determinar la probabilidad de que, por lo menos, 2 de las
cartas
adicionales sean tambin picas.
5.- Se lanza un par de dados. Encontrar la probabilidad de que el mximo de
los dos nmeros resultantes sea mayor de 4.
6.- De 120 estudiantes, 60 estudian francs, 50 estudian espaol y 20
estudian francs y espaol. Si se escoge un estudiante al azar, encontrar
la probabilidad de que ste:
(i) est estudiando francs o espaol
(ii) no est estudiando ni francs ni espaol.
7.- Tres nios y 3 nias se sientan en fila. Encontrar la probabilidad de que:
(i) las 3 nias se sienten una al lado de la otra
(ii) los nios y las nias se sienten en sillas alternadas.
8.- En una ciudad , el 40 % de la poblacin tiene cabello castao, el 25 %
tiene ojos oscuros y el 15 % tiene cabello castao y ojos oscuros. Se
selecciona al azar una persona de la ciudad
(i) si tiene cabello castao Cul es la probabilidad de que tambin
tenga ojos oscuros?
(ii) si tiene ojos oscuros Cul es la probabilidad de que no tenga
cabello castao?
(iii) Cul es la probabilidad de que no tenga cabello castao ni ojos
oscuros?
Quinta parte

1.Se dispone de una bolsa con nmeros del 1 al 10. Sea A el suceso el
nmero extrado es mayor que 7 y sea B el suceso : el nmero extrado es
par .
Seale el significado de :
a) , , , , B A B A B A
b) . , , , , , B A B A B A B A B A B A
2. En el problema anterior, calcule la probabilidad de cada uno de los sucesos.
3. Una caja contiene 2 bolitas rojas y 3 azules. Hallar la probabilidad de que si
dos bolitas se extraen al azar (si reemplazo ).
a) ambas sean azules, b) ambas sean rojas , c) una sea roja y otra no.
Prof: Natalia Henrquez 69
Prof: Natalia Henrquez
4. Idem ( con reemplazo).
5. Una Asistente Social atendi en el ltimo ao a 840 trabajadores
provenientes de tres Poblaciones del Gran Santiago ( P1,P2,P3) y ocupados en
4 fbricas ( F1, F2, F3, F4 ).

Fbrica Poblacin
P1 P2
P3
F1 70 30 20
F2 60 50 40
F3 10 90 80
F4 150 130 110
Si se elige al azar uno de estos trabajadores. Cul es la probabilidad que:
a) Trabaje en F3 y viva en P2?.
b) Viva en P1 P3 y trabaje en F4 ?.
c) Trabaje en F2, dado que vive en P3?
d) Viva en P1, sabiendo que trabaja en F3?.
6.Sean A y B dos sucesos cualesquiera definidos en un mismo espacio
muestral .
Se sabe que: P(A) = 2/5, P(B) = 1/3, P(AUB) = 8/15. Segn esto
determine :
). ' ( ), ' ( ), ' ( ), ( ) B A P B P A P B A P a
). ' ( ), ' ( ), ' ' ( ) B A P B A P B A P b
). / ( ), / ( ), ' ( ) A B P B A P B A P c
d) Son independientes A y B ? Fundamente su respuesta.
7. Dado que los eventos A y B son independientes y que P(A) = 0.3 y P(B)
= 0.6 ,
evaluar las siguientes probabilidades:
). / ( ), ' ' ( ), ' ( ), ' ( ), ( ), ( B A P B A P A P A P B A P B A P
8.La tabla siguiente muestra en nmero de estudiantes, clasificados segn
sexo y si usan o no auto para ir a la universidad.

Sea C el evento
usar auto y M ser hombre . Calcular
`) ' ( ) ' / ( ) / ' ( ), ( ) ( ), ( ), ( ) C M P C M P M C P M C P M C P M P C P a
Prof: Natalia Henrquez
Usa auto No usa
auto
Hombre
s
20 40
mujeres 10 30
70
Prof: Natalia Henrquez
9.Evalu las siguientes probabilidades suponiendo que A y B son eventos
independientes.
4 / 3 ) ( 2 / 1 ) ( ) ( ) B P y B A P si A P a
2 . 0 ) ( 4 . 0 ) / ( ) ( ) B A P y B A P si B p b
10.La agencia de Consultoras Laborales Negocio Leal ha llevado a cabo una
investigacin, con el fin de establecer la relacin existente entre el nivel de
recompensas extrnsecas que se otorga a los empleados del Hospital
Psiquitrico de Santiago y el nivel de motivacin intrnseca que los mismos
presentan respecto al trabajo. Ello fue cuantificado en trminos de porcentajes.

Nivel de
motivaci
n
intrnsec
a
Nivel de recompensas
extrnsecas
bajo medio alto Total en %
Bajo 6 7 5 18
Medio 10 11 13 34
alto 13 15 20 48
total % 29 33 38 100
Si se selecciona un empleado del Hospital al azar:
a) Determine la probabilidad de que tenga un alto nivel de motivacin
intrnseca haca el trabajo.
(48%)
b) Calcule la probabilidad de que tenga un bajo nivel de recompensa
extrnseca y un nivel medio de motivacin intrnseca hacia el trabajo.
(10%)
c) Determine la probabilidad de que tenga un bajo nivel de recompensa
extrnseca o un bajo nivel de motivacin intrnseca hacia el trabajo.
(41%)
d) Cul es la probabilidad de que no reciba un alto nivel de recompensa
extrnseca y tenga un alto nivel de motivacin intrnseca hacia el
trabajo. (28%)
e) Cul es la probabilidad de que no reciba un nivel medio de recompensa
extrnseca. (67%)
f) Calcule la probabilidad de que tenga un alto nivel de motivacin
intrnseca hacia el trabajo y se le haya otorgado un bajo nivel de
recompensa extrnseca. (44.8%)
Prof: Natalia Henrquez 71
Prof: Natalia Henrquez
g) Determine la probabilidad de que tenga un bajo nivel de motivacin
intrnseca hacia el trabajo y un alto nivel de recompensa extrnseca.
(5%)
h) Cul es la probabilidad de que tenga un nivel medio de recompensa
extrnseca o un nivel medio de motivacin intrnseca hacia el trabajo.
(56%)
i) Determine la probabilidad de que tenga un nivel medio o alto de
motivacin intrnseca hacia el trabajo.
(82%)
j) Cul es la probabilidad de que tenga un nivel medio de motivacin
intrnseca hacia el trabajo si se le ha otorgado un nivel bajo de
recompensa extrnseca. (34.5%)
k) Calcule la probabilidad de que tenga un alto nivel de motivacin
intrnseca hacia el trabajo dado que recibe un nivel medio de
recompensa. (45.5%)
11.- En el hospital Psiquitrico se investig la probabilidad de la presencia de
sntomas de catatonia y de pensamiento incoherente en 300 pacientes
psicticos agudos en trminos de porcentaje, donde se obtuvo la informacin
siguiente:
Sntoma de
Pensamien
to
incoherent
e
Sntoma de Catatonia
Si No Total
Si 11 14 25
No 77 198 275
Total 88 212 300

Si se elige a uno de aquellos pacientes al azar:
a) Determine la probabilidad que presente el sntoma de catatonia dado
que presenta el sntoma de pensamiento incoherente.
b) Cul es la probabilidad de que un paciente presente sntoma de
catatonia si no presenta sntoma de pensamiento incoherente.
c) Calcule la probabilidad de que un paciente no presente sntoma de
pensamiento incoherente si no presenta sntoma de catatonia .
d) Determine la probabilidad que no presente el sntoma de catatonia dado
que presenta el sntoma de pensamiento incoherente.
e) Calcule la probabilidad de que un paciente presente sntoma de
pensamiento incoherente si no presenta sntoma de catatonia.
Prof: Natalia Henrquez 72
Prof: Natalia Henrquez
12- Encontrar a) f (5, 1, 1/3) b) f (7, 2,1/2) c) (4, 2, 1/4 ) (use distribucin
binomial)

13.- Se saca y se recoloca una carta 3 veces, de una baraja de 52 cartas.
Encontrar la probabilidad de que:

(i) se saquen dos corazones
(ii) se saquen tres corazones
(iii)se saque, por lo menos, un corazn.
14.- Una caja contiene 3 fichas rojas y 2 fichas blancas. Se saca y se recoloca
tres veces 1 ficha de la caja. Encontrar la probabilidad de que.
(i) se saque siempre una ficha roja
(ii) se saquen 2 fichas rojas
iii) se saque, por lo menos, 1 ficha roja.
*15.- Se lanza un par de dados corrientes sea X la variable al azar que denota
el mximo de los dos nmeros que ocurran. Encontrar la distribucin y
expectativa de X.
*16.- Se lanzan 5 monedas corrientes, sea X la variable al azar que denota el
mnimo de los dos nmeros que ocurren. Encontrar la distribucin y
expectativa de X.
*17.- Un jugador lanza tres monedas corrientes. Gana $ 5 si salen 3 caras, $ 3
si salen 2 caras y $ 1 si solamente sale una cara. Por otra parte pierde $ 15
si salen 3 sellos. Encontrar el valor del juego para el jugador.
18.- Una caja contiene 8 artculos, entre los cuales hay 2 defectuosos. Una
persona selecciona 3 artculos de la caja. Encontrar el nmero esperado de
artculos defectuosos que la persona ha sacado.
19.- De los pernos que una fbrica produce, el 2% tiene defectos. En un lote de
8.000 pernos que salen de la fbrica, cuntos se esperan con defectos?
PROBABILIDAD CONDICIONAL Y TEOREMA DE BAYES
1.Se lanza un par de dados. Encontrar la probabilidad de que la suma sea 10 o
mayor s:
i) aparece un 5 en el primer dado
ii) aparece un 5 en, por lo menos, uno de los dados.
2.Sean A y B eventos con P(A)=1/2, P(B)=1/3 y
4 / 1 ) ( B A P
.Encontrar
Prof: Natalia Henrquez 73
Prof: Natalia Henrquez
i) ) / ( ) ) / ( ) ) ( ) ) / ( ) ) / (
c c c c
A B P v B A P iv AUB P iii A B P ii B A P
3.Sean A y B eventos con P(A) = 3/8, P(B)=5/8 y P(AUB)=3/4. Encontrar
P(A/B) y P(B/A).
4.En cierta Universidad, el 4% de los hombres y el 1% de las mujeres miden
mas de 180 cm. Adems, el 60% de los estudiantes son mujeres. Ahora bien, si
se selecciona al azar un estudiante y es de estatura
mayor de 180cm, Cul es la probabilidad de que este estudiante sea una
mujer?.
5.Tenemos tres urnas, como sigue:
La urna A contiene 3 fichas rojas y 5 fichas blancas.
La urna B contiene 2 fichas rojas y 1 ficha blanca.
La urna C contiene 2 fichas rojas y 3 fichas blancas.
Se selecciona una urna al azar y se saca 1 ficha de la urna. Si la ficha es roja,
Cul es la probabilidad de que hubiera salido de la urna A?.
4.Hay 3 monedas en una caja, una de ellas tiene 2 caras, la segunda es normal
y la tercera muestra cara con probabilidad del 75%.
Dado que cuando se elige una de las tres monedas al azar y se lanza con
resultado cara.
Cul es la probabilidad que esta sea la moneda de 2 caras?.
***5.Pedro quiere enviar una carta a Mara, la probabilidad que Pedro escriba la
carta es de 0.8.
La probabilidad de que el correo no la pierda es 0.9. La probabilidad de que el
cartero la entregue es de 0.9. Dado que Mara no ha recibido la carta.
Cul es la probabilidad que Pedro no halla escrito la carta?.
***6.Se dispone de una urna que contiene 5 fichas blancas y 10 fichas negras y
adems de un dado normal.
El experimento consiste en lanzar el dado y luego escoger una de la urna sin
reposicin tantas fichas como puntos se obtiene en el dado.

a) Cul es la probabilidad que dos de las fichas extradas sean blancas?
b) Cul es la probabilidad de que el dado muestre 3 si todas las fichas
extradas fueron blancas?.
7. Se han registrado el nmero de pasajeros que llegan a un hotel en dos das
distintos, y el peso (kgs) de sus respectivos equipajes, los que se muestran
en la siguiente tabla:
Peso en Kilos DIA
LUNES MARTES Total
Menos de 10
10 a 20
Mayor a 20
25
30
100
80
Total 100 250
Prof: Natalia Henrquez 74
Prof: Natalia Henrquez
a. Determine la probabilidad de que un pasajero llegue el da Lunes y su
equipaje pese ms de 20 kilos.
b. Con qu probabilidad un pasajero tiene un equipaje con peso entre 10 y
20 kilos y llega el da Lunes?
c. Si un pasajero tiene un equipaje con peso menor a 10 kilos, Con qu
probabilidad lleg el Martes?.
d. Dado que el pasajero llega un da Martes, Cul es la probabilidad de que
su equipaje pese menos de 20 kilos?
8. En poca de verano se estima que, de todas las personas que llegan al
aeropuerto Arturo Merino Bentez , el 60% viaja a Estados Unidos ,el 30%
viaja a Europa y el resto lo hace al sur de Chile.
De las personas que viajan a Europa ,el 60 % lo hace como viaje de
placer mientras que esta cifra es del 80% para los que viajan a Estados
Unidos y del 90% para los que viajan al sur de Chile.
Cul es la probabilidad de que una persona que viaja por placer lo haga
haca el sur
de Chile?.

Prof: Natalia Henrquez 75
Prof: Natalia Henrquez
Variable Aleatoria y Distribucin Normal
VARIABLE ALEATORIA DISCRETAS Y CONTINUAS
DEFINICIN
Si es un espacio muestral con una medida de probabilidad y X es una
funcin con valor real definida con respecto a los elementos de entonces
X se denomina VARIABLE ALEATORIA.
Ejemplo: Se lanzan 3 monedas, X={nmero de caras obtenidas}
X 0 1 2 3
P(X) 1/8 3/8 3/8 1/8
GRAFIQUE.
DEFINICIN
SI X es una variable aleatoria discreta, la funcin dada por :
f(x)=P(X=x) X x se denomina Funcin de densidad de Probabilidad
Funcin de Cuanta Distribucin de Probabilidad de X.
TEOREMA
f es una funcin de probabilidad de una variable aleatoria discreta si:
Prof: Natalia Henrquez 76
Prof: Natalia Henrquez
1) f(x)=P(X=x) 0 2)
1 ) (

x
x f
Ejemplo: verificar que
25
2
) (
+

x
x f para x=1,2,3,4,5 es una
f.d.p
DEFINICIN
Si X es una v.a.d, la funcin


x t
t f x X P x F ) ( ) ( ) (
X x donde
f(t) es f.d.p.
F(x) recibe el nombre de funcin de distribucin acumulada.
TEOREMA
F(x) es una F.D.A de la v.a.X si :
1) F(
0 )
, 2) F(
1 )
, 3) Si b a entonces
) ( ) ( b F a F

X b a ,
Determine F(X) para las monedas.
TEOREMA
Si el intervalo de la v.a.X consta de los valores
n
x x x x < < < < ...
3 2 1

entonces
n i x X F x X F x f y x F x f
i i i
,..., 3 , 2 , 1 ) ( ) ( ) ( ) ( ) (
1 1 1


Ejemplo. Si X denota la variable aleatoria definida como la suma de los
nmeros al lanzar dos dados legales, determine su distribucin de
Probabilidad.

Solucin:
Prof: Natalia Henrquez 77
Prof: Natalia Henrquez

{ } { }
{ } { }
{ } { }
{ } { }
{ } { }
{ } { }
{ } { }
{ } { }
{ } { }
{ } { }
{ } { }
36
1
) 6 , 6 ( 12
36
2
) 5 , 6 ( ), 6 , 5 ( 11
36
3
) 4 , 6 ( ), 5 , 5 ( ), 6 , 4 ( 10
36
4
) 3 , 6 ( ), 4 , 5 ( ), 5 , 4 ( ), 6 , 3 ( 9
36
5
) 2 , 6 ( ), 3 , 5 ( ), 4 , 4 ( ), 5 , 3 ( ), 6 , 2 ( 8
36
6
) 1 , 6 ( ), 2 , 5 ( ), 3 , 4 ( ), 4 , 3 ( ), 5 , 2 ( ), 6 , 1 ( 7
36
5
) 1 , 5 ( ), 2 , 4 ( ), 3 , 3 ( ), 4 , 2 ( ), 5 , 1 ( 6
36
4
) 1 , 4 ( ), 2 , 3 ( ), 3 , 2 ( ), 4 , 1 ( 5
36
3
) 1 , 3 ( ), 2 , 2 ( ), 3 , 1 ( 4
36
2
) 1 , 2 ( ), 2 , 1 ( 3
36
1
) 1 , 1 ( 2











P X P
P X P
P X P
P X P
P X P
P X P
P X P
P X P
P X P
P X P
P X P
Es decir la variable aleatoria X puede tomar cualquier valor entero entre 2 y
12, y la probabilidad de que tome cada uno de estos valores est dada por la
expresin anterior y adems debe cumplir que la suma de todas estas
probabilidades debe ser 1( verificar ) y la variable aleatoria puede tomar los
siguientes valores { } 12 , 11 , 10 , 9 , 8 , 7 , 6 , 5 , 4 , 3 , 2 X
VARIABLES ALEATORIAS CONTINUAS
DEFINICIN
f(x) es una funcin de densidad de probabilidad de la variable aleatoria
continua X y


b
a
dx x f b X a P ) ( ) ( la probabilidad entre a y b es el rea bajo la
curva y = f(x)
Propiedad: P(X=c)=0.
TEOREMA
Si X es v.a continua es claro que P
) ( ) ( ) ( ) ( b X a P b X a P b X a P b X a < < < <
.
Prof: Natalia Henrquez 78
Prof: Natalia Henrquez
TEOREMA
f(x) es f.d.p si : 1) f(x) X x 0 , 2)


1 ) ( dx x f
Ejemplo:

'

>

~ , 0
0 ,
) (
3
x p a r a k e
x f
x
Determine la constante k y P(0.5
) 1 X
.
DEFINICIN
X v.a continua la funcin



x
dt t f x X P x F ) ( ) ( ) ( Adems P(
) ( ) ( ) a F b F b X a
y F(x)=f(x).
DEFINICIN VALOR ESPERADO
Si X es una v.a.d y f(x) su f.d.p luego el valor esperado o
media o esperanza matemtica de esta v.a.d es:


x
x f x X E ) ( ) (
ejemplo: lanzar un dado.
En el caso continuo :


dx x f x X E ) ( ) (
DEFINICIN VARIANZA de una variable aleatoria ya sea discreta o
continua.
[ ]
2 2
) ( ) ( ) ( X E X E X V
Ejemplos:
1. En un lote de 12 televisores hay dos defectuosos. Si se elige al azar 3 de
los televisores para enviarlos a un hotel .Cuntos aparatos
descompuestos pueden esperarse en el envo?.
Solucin:
Prof: Natalia Henrquez 79
Prof: Natalia Henrquez

,
_

,
_

,
_

3
1 2
3
1 0 2
) (
x x
x P
para x=0,1,2
2
1
22
1
2
22
9
1
11
6
0 ) ( + + X E
2. Ciertas mediciones codificadas del dimetro de avance de la cuerda de
un ajuste tienen la
densidad de probabilidad:

'

< <
+
~ , 0
1 0
) 1 (
4
) (
2
x p a r a
x x f
44 , 0 ) ( X E
TEOREMA
Si X es una v.a discreta y f(X) su f.d.p el valor esperado de la v.a g(X)
es :


x
x f x g X g E ) ( ) ( )) ( (
Prof: Natalia Henrquez 80
Prof: Natalia Henrquez
En el caso continuo


dx x f x g X g E ) ( ) ( )) ( (
Ejercicio 1: X puntos obtenidos al lanzar un dado y g(x)= 1 2
2
+ x . Calcular
E(g(X)).
Ejercicio 2:

'

>

~ , 0
0 ,
) (
x e
x f
x
Determine

,
_

4
3x
e E

Propiedades
Si a y b son constantes entonces E( aX+b)=a E(X)+b. Demostrar
Si a=0 entonces E(b)=b, Si b=0 entonces E(ax)=aE(X)
Si
n
X X X Z + + + ...
2 1
entonces [ ]

n
i
i
X E Z E
1
) (
Pruebe [ ]


+
n
i
i n i i n n
X E b a b aX E
0
) ( ) (
Pruebe que la varianza de la v.a X est dada por:
2 2
)) ( ( ) ( ) ( X E X E X V


EJERCICIOS RESUELTOS
1 La demanda diaria de cierto artculo esta dada por la siguiente
distribucin de probabilidad.
Prof: Natalia Henrquez 81
Prof: Natalia Henrquez
( )

'


, 0
1 6
*
2
d K
d D P
c o c
d
. .
5 , 4 , 3 , 2 , 1
a) Determine la constante K.
Datos a considerar:
Variable Discreta
i)
[ ] 0 d p
ii)
[ ]

1 d p
Formula para sumatorias con variables elevadas al cuadrado
( )( )

+ +

n
i
n n n
d
1
2
6
1 2 1
Formula para sumatorias con variables elevadas al cubo
( )
2
1
3
2
1

1
]
1

n
i
n n
d
1
16
1
16
*
5
1
2
5
1
2

d
d
d
k
d k
Aplicamos teorema
( ) ( )
55
6
11 * 6 * 5
6
1 5 * 2 * 1 5 5

+ +
1 55 *
16

k
Sol:
55
16
k
b) Calcule la demanda esperada y su desviacin estndar.
[ ] ( )

5
1
*
d
d p d D E
Prof: Natalia Henrquez 82
Prof: Natalia Henrquez
[ ]



5
1
3
5
1
2
55
1
55
*
d d
d
d
d D E
Aplicamos teorema
( )
4
55
225
2
1 5 5
2
5
1
3

1
]
1

i
d
Sol: - La demanda esperada es de aproximadamente 4 unidades.
[ ] [ ] [ ] ( )
2 2
d E d E d V
[ ] ( ) d p d d E
d
*
5
1
2 2

En general:
( )
[ ]
( )
( ) x p g g E
x x
*

[ ] [ ] [ ] y E b x E a by ax E * * + +
[ ] ( ) 8 . 17 979 *
55
1
*
55
1
*
55
1
55
*
5
1
2
2
5
1
4
5
1
2
2 2


d d d
d d
d
d d E
[ ] ( )
1 1
1 072 . 1 09 . 4 8 . 17
2

d V
Sol: - La desviacin estndar es 1.
c) En los das en que la demanda es a lo menos dos artculos, Cul es la
probabilidad de que la demanda sea inferior a 3 artculos?
[ ]
[ ]
[ ] b p
b a p
b a p

|
x = Inferior a 3 artculos
y = Demanda superior o igual a 2 artculos
[ ]
[ ]
[ ]
0 7 4 . 0
5 4
4
5 5
5 4
5 5
4
2
|

y p
d p
y x p
Sol: - La probabilidad es de un 7.4%
d) Con que probabilidad un da cualquiera no se produce demanda de
dicho artculo?
Prof: Natalia Henrquez 83
Prof: Natalia Henrquez
Sol: - Probabilidad 0.
2 El nmero de funcionarios con operaciones bancarias mal realizadas,
durante una semana, es una variable aleatoria con f.d.p dada por:
P( X = j ) = A(20-j) con j=0,1,2,,20.
La prdida ocasionada por este concepto est dada por la expresin:
C=100X-X
2
a) Si en una semana se encuentran menos de 5 funcionarios con
operaciones bancarias mal realizadas, Cul es la probabilidad de que
slo uno de los funcionarios tenga operaciones bancarias mal
realizadas?
b) Determine la prdida esperada.
3 El nmero de autos x que se venden diariamente en una automotora,
es una variable aleatoria que tiene la siguiente funcin de cuanta :
cx, x=1
2cx
2
, x=2
N(X=x) = 3cx
3
, x=3
c, x=4
a)Determine el valor de c para que la funcin quede bien definida.
( )
1 91
1 81 8 1
1
4
1

+ + +

c
c c c c
x f
x
Sol: - El valor de c es de
91
1
a)Determinar la probabilidad de vender diariamente como mnimo un
auto, si se sabe que se vendieron menos de cuatro de ellos.
Si consideramos
X = venta de al menos 1 auto
Y = se venden menos de 4
[ ]
[ ]
[ ] y p
y x p
y x p

|
Prof: Natalia Henrquez 84
Prof: Natalia Henrquez
[ ] ( )
[ ] ( ) ( ) [ ]
[ ]
[ ]
91
90
90 *
91
1
27 * 3 4 * 2 1
91
1
3
1

+ +

y p
y p
y p
i f y p
i
[ ]
[ ] 1
91
90
91
90
|
91
90


y x p
y x p
Sol: - La probabilidad es de un 100%
a)Si al vendedor de la automotora, le dan una comisin de $5000 por
auto vendido. Qu monto espera obtener diariamente tal vendedor por
este concepto?
[ ] ( )
[ ] ( )
[ ]
[ ] 000 . 10 000 . 5 * 2 09 . 2
91
264
264 *
91
1
4 243 16 1 *
91
1
4
1

+ + +

x E
x E
x E
x f C x E
x
Sol: - La comisin esperada es de $10.000.-
4 La cantidad de boletos de lotera que vende un empleado de cierta
agencia por hora es una variable caracterizada por:
2Ax, x=1,2,3.

P(X=x)= A(9-x), x=4,5,6
0, c.o.c
a)Si en una hora un vendedor vendi menos de 5 boletos, calcule la
probabilidad de que por lo menos haya vendido dos boletos.
Prof: Natalia Henrquez 85
Prof: Natalia Henrquez

1 ) (x p
A(2+4+6+5+4+3)=1

24
1
A
a)P(x|y)
x = por lo menos 2 boletos
y = vendi menos de 5 boletos
1 2 3 4 5
[ ] ( )
24
15
15 *
24
1
5 6 4 , + + A y x p
[ ] ( )
24
17
17 *
24
1
5 6 4 2 + + + A y p
[ ] 8 8 . 0
1 7
1 5
2 4
1 7
2 4
1 5
| y x p
Sol:- La probabilidad es de un 88%
a)Calcule la esperanza de x.
[ ] ( )

6
1 x
x f x E
E[x]= A(2+7+18+20+20+24)

E[x]= 1 (92) = 3.13
24
Sol: - La esperanza es de 3.13
a)Un empleado recibe un premio de $10.000 si en una hora vende ms
de cuatro boletos, en caso contrario no recibe nada, Calcule el ingreso
esperado por este concepto.
Sea Y=vende ms de 4 boletos

Y Vende ms de 4
boletos
Si no
P(y) 7/24 17/24
[ ] 24 / 70000 0 *
24
17
10000 *
24
7
+ G E .
Sol: - El ingreso esperado sera aproximadamente de $70000/24
Prof: Natalia Henrquez 86
Prof: Natalia Henrquez
5 Un banco de la localidad afirma que el 80% de las personas de la cuidad
tienen en l una cuanta. De 20 personas elegidas al azar Cul es la
probabilidad de que 9 tengan cuenta?
Sol:
1 1 9
) 2 . 0 ( * ) 8 . 0 ( *
9
2 0

,
_

p
( ver distribucin binomial )
6 Un sobre contiene en miles de pesos, 3 billetes de $20 y 1 billete de $10.
Se seleccionan 2 de estos billetes al azar:
a) Determine el espacio muestra del experimento.
Sol: # =6
b) Determine la probabilidad de que el monto de los billetes seleccionados
no exceda los $30.
5 . 0
6
3
6
3 * 1
2
4
1
3
*
1
1
) 30 (

,
_

,
_

,
_

P
7 Con respecto al problema 12 defina como Y la variable aleatoria que
representa la suma de los billetes extrados.
a) Determine la funcin de probabilidades (cuanta) de la v.a. Y
Y 30 40
P(Y) 0.5 0.5
[ ] [ ] 5 . 0
6
3
2
4
1
3
*
1
1
30 5 . 0
6
3
2
4
2
3
40

,
_

,
_

,
_

,
_

,
_

p P
b) Determine Esperanza y Varianza de la v.a. Y
[ ] 35 5 . 0 * 40 5 . 0 * 30 + y E
Sol: - La Esperanza es 35.-
Prof: Natalia Henrquez 87
Prof: Natalia Henrquez
[ ] [ ] [ ] ( )
[ ]
[ ] 25 1225 250 . 1 35 250 . 1
250 . 1 800 450
5 . 0 * 40 5 . 0 * 30
2
2 2 2
2 2

+
+

y V
y E
y E y E y V
Sol: - La Varianza es 25.-
c) Determine la probabilidad de que Y no exceda los $30.
Sol: - La probabilidad que no exceda es de 0.5.-
GUIA DE ESPERANZA Y VARIANZA
1. Considere la v.a.d con f.d.p

'

, 0
1 0 0 , . . . , 3 , 2 , 1 ,
4
) (
x
c x
x f
Obtener:
a) el valor de c.
b) los valores de la funcin de prob y distribucin acumulada para x =
1,2,3,4,...
c) calcular [ ] [ ] 3 3 x P y x P .
2. Considere la v.a.c con f.d.p,

'

, 0
1 0 ,
) (
3
x c x
x f
se pide:
a) el valor de c.
b) la funcin de distribucin.
c) la media.
d) la probabilidad de que la variable est comprendida entre 0,2 y 0,7.
3. La v.a.c X tiene funcin de densidad:

'

>

<

1 , 0
1 0 , 1
0 , 0
) (
x
x
x
x f
Determinar:
a) la media b)varianza c) [ ] 8 , 0 2 , 0 x P
Prof: Natalia Henrquez 88
Prof: Natalia Henrquez
4. Verifique que
) 1 (
2
) (
+

k k
x
x f
para x = 1,2,3,...,k puede fungir como
la distribucin de probabilidad de una v.a.d.
5. Determine el valor de c para que f pueda servir como la distribucin de
prob. de una v.a.d.

3 , 2 , 1
4
1
) ( )
. 4 , 3 , 2 , 1 2 ) ( )
, . . . , 4 , 3 , 2 , 1 ) ( )
5 , 4 , 3 , 2 , 1 , 0
5
) ( )
. 5 , 4 , 3 , 2 , 1 , ) ( )
2

,
_

,
_


x p a r a c x f e
x p a r a c x f d
k x p a r a c x x f c
x p a r a
x
c x f b
x p a r a c x x f a
x
x

6. Demuestre que no hay valores de c tales que f no pueda fungir como
distribucin de probabilidad.

.. . 3 , 2 , 1 , 2 ) ( )
,... 3 , 2 , 1 , ) ( )


x c x f b
x
x
c
x f a
x
7. En un lote de 12 televisores hay dos que estn defectuosos. Si se eligen al
azar 3 de los televisores para enviarlos a un hotel. Cuntos aparatos
descompuestos pueden esperarse en el envo? Cul es la varianza?.
8. Una grabadora de cintas contiene 6 transistores, de los cuales dos estn
defectuosos. Si se seleccionan al azar dos de estos transistores, extrados de la
grabadora, e inspeccionados y X es el nmero de unidades defectuosas
observadas, obtenga.
Prof: Natalia Henrquez 89
Prof: Natalia Henrquez
a) la distribucin de probabilidad de X.
b) la distribucin acumulada de X.
c) grafique ambas.
9. Una moneda est cargada y de este modo hay tres veces mayor
probabilidad de que caigan sellos en lugar de caras. En tres lanzamientos
independientes de la moneda determine:
a) la distribucin de prob de la variable aleatoria X que representa el nmero
de sellos que se obtiene.
b)l a prob que cuando mucho caigan 2 sellos.
c) obtenga la funcin de distribucin acumulada de la v.a. X y trace su grfica y
obtenga
[ ] [ ] 2 3 1 > < x P y x P .
10. La f.d.p de la v.a.c. X est dada por:

'

< <

, 0
7 2 , 5 / 1
) (
x
x f
a) demuestre que el rea situada debajo de la curva (sobre el eje x) es igual a
1.
b) determine [ ]. 5 3 < <x P
11. Obtenga el valor esperado de la v.a. Y cuya f.d.p est dada por:

'

< < +

, 0
4 2 ) , 1 (
8
1
) (
y y
x f
12. Determine E(X) y V(X) para:

'

<
< <

, 0
2 1 , 2
1 0 ,
) ( x x
x x
x f
13. Para la f.d.p de la v.a.c X est dada por:

'

< <

, 0
3 1 ,
) ( l n
1
) (
x
x x x f
a) determine (si es posible) E(X), ) ( ), (
3 2
X E X E
b) determine [ ] 1 3 2
2 3
+ + X X X E
Prof: Natalia Henrquez 90
Prof: Natalia Henrquez
14. Sea f.d.p,

'

<

<
<

, 0
3 2 ,
2
3
2 1 , 2 / 1
1 0 , 2 /
) (
x
x
x
x x
x f determine [ ] 3 5
2
+ X X E
15. Suponga que el tiempo que tardan en atender a un individuo en una
cafetera es una v.a. con una f.d.p dada por:

'

>

, 0
0 ,
4
1
) (
4
x e
x f
x
Determine el tiempo promedio de espera y su varianza.
16. Un juego de azar se considera justo o equitativo, si la esperanza de cada
jugador es igual a cero. Si una persona nos paga $10 cada vez que tiramos un
tres o un cuatro con un dado.
Cunto debemos pagar a esa persona cuando tiremos un 1,2,5 o 6 para
tornar el juego equitativo?.
17. Supongamos que una mquina dispensadora de bebidas se traga la
moneda el 30% de las veces.
Determine la media de intentos para que la mquina se trague la moneda si
se realizan 4 ensayos.
18. Una mquina envasadora, falla con tasa igual a 3 fallas por da.
Calcule la prob. de que un da cualquiera no falle; si sigue una distribucin de
poisson .
19. El nmero promedio de camiones que llegan en un da cualquiera a un
depsito de camiones en cierta ciudad es segn se sabe 12. Cul es la
probabilidad de que en un da dado lleguen menos de 9 camiones a este
depsito? (asuma que el nmero de camiones que llegan en un da dado sigue
una distribucin de poisson). Calcule la media y la varianza.
20. Si X es una variable aleatoria continua con distribucin exponencial,
entonces:
) ( ) / ( t X P s X t s X P > > + >
.
Prof: Natalia Henrquez 91
Prof: Natalia Henrquez
DISTRIBUCIN NORMAL
La variable aleatoria continua con distribucin Normal es sin duda, una
de las ms importante en el campo de la estadstica, por describir de manera
aproximada una gran gama de fenmenos de las ciencias particularmente la
sicologa y la biologa, pero tambin se aplica de manera amplia en la industria
y la investigacin.
Definicin
Sea X variable aleatoria normal, con media y desviacin
estndar , luego su funcin de densidad est dada por:

< <

,
_


x con e x f
x
,
2
1
) (
2
2
1


.
Y su notacin es ) , (
2
N X
Luego la probabilidad en un intervalo es :


b
a
dx x f b X a P ) ( ) ( .
Propiedades de la Distribucin Normal.
La moda ( mxima frecuencia relativa), que es el punto sobre el eje
horizontal donde la curva tiene su mximo, ocurre precisamente en la
abscisa x= .
La curva es simtrica alrededor de su eje vertical donde se tiene la
media .
La curva tiene dos puntos de inflexin que ocurren en x=t ; es
cncava hacia abajo si - <X< + y es cncava hacia arriba en
cualquier otro punto.
La curva normal se acerca muy rpidamente al eje horizontal en forma
asinttica en cualquiera de las dos direcciones, alejndose de la media.
El rea bajo la curva y arriba del eje horizontal es igual a 1.
Su grfico es:
Prof: Natalia Henrquez 92
Prof: Natalia Henrquez
Si en una variable aleatoria X distribuida normalmente, con media y
desviacin estndar , se realiza el cambio de variable :

x
z
la
funcin anterior se simplifica y ms aun sus valores estn tabulados por lo
cul no es necesario resolver la integral cada vez que queramos calcular
probabilidades.
Notacin:
) 1 , 0 ( N Z
Su grfico queda:
Observacin: la media de la variable aleatoria z es cero y su varianza 1.
Ejemplo de estandarizacin:
Si x = 168; media = =171; =3, el valor de
1
3
171 168

z
,
En cambio si x=129; media = =128; =10, el valor de
1 . 0
10
128 129

z ,
En el primer caso, el signo indica que el valor est bajo el valor medio de la
variable,
mientras que en el segundo caso, el signo positivo indica que el valor se
encuentra sobre su valor medio.
Ejemplo.
Una persona obtiene 32 puntos en la parte Matemtica de la PSU, ( corregida
como el total de
preguntas correctas contestadas menos un cuarto de las erradas).
Prof: Natalia Henrquez 93
Prof: Natalia Henrquez
Supongamos que el puntaje medio de la prueba fue de 33 puntos con una
desviacin estndar de
3 puntos, luego su puntaje estndar ser de:
33 . 0
3
33 32

z , por otro lado si queremos transformar este valor -0.33 ,


a una escala
cuya media sea de 600 puntos y cuya desviacin estndar es de 150 puntos, el
nuevo puntaje de la persona ser:
5 . 550 600 150 * 33 . 0
150
600
33 . 0 +

x x
x
puntos
Uso de la Tabla de la Distribucin Normal
Supongamos que X tiene una distribucin normal
) 1 , 0 ( N X
y se desea
determinar cierta probabilidad, como por ejemplo la de un valor inferior a c,
perteneciendo c al recorrido de X. Entonces la probabilidad,
) ( ) ( c c X P <
,
estar dada por un valor numrico que corresponder al rea bajo la curva de
esta distribucin, valor que encontraremos en la tabla siguiente ( ver tabla 1).

Ejemplo: Si ) 1 , 0 ( N X , determinar las siguientes probabilidades:
1) ) 96 . 1 ( < X P
2)
) 96 . 1 ( X P
3)
) 96 . 1 0 . 1 ( X P
Respuestas:
1) Para determinar esta probabilidad, basta con observar la tabla
y obtener el
valor respectivo que aparece al combinar la fila (1.9) con la
columna (0.06), cuyo valor es 0.975.
2) Para determinar esta probabilidad, podemos utilizar el
concepto de
complemento de un suceso donde:
Prof: Natalia Henrquez 94
Prof: Natalia Henrquez
. 025 . 0 975 . 0 1 ) 96 . 1 ( 1 ) 96 . 1 ( < X P X P
3) Para determinar esta probabilidad, podemos utilizar:

. 1337 . 0 8413 . 0 975 . 0 ) 0 . 1 ( ) 96 . 1 ( ) 96 . 1 0 . 1 ( X P X P X P
Ejemplo:
Se sabe que el puntaje en cierto test psicolgico, distribuye normal con
media 50 y desviacin estndar de 20 puntos. Determinemos entonces, la
probabilidad de que una persona obtenga menos de 70 puntos en este test.
Respuesta: Se desea determinar P(X<70), para esto utilizamos la propiedad
sealada anteriormente en que se aplica un cambio de variable:
8413 . 0 ) 0 . 1 ( ) 0 . 1 ( )
20
50 70
( <

< Z P Z P
Tabla 1


c
u
du e c Z P c
2
2
2
1
) ( ) (

z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09


-3.9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
-3.8 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001
-3.7 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001
-3.6 0.0002 0.0002 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001
-3.5 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002
-3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002
-3.3 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
-3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005
-3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007
-3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010
-2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
Prof: Natalia Henrquez 95
Prof: Natalia Henrquez
-2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
-2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
-2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
-2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
-2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
-2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
-2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
-2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
-2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
-1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
-1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
-1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
-1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
-1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
-1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
-1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
-0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
-0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
-0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
-0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
-0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
-0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
.
z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
Prof: Natalia Henrquez 96
Prof: Natalia Henrquez
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
EJERCICIOS RESUELTOS
1 El tiempo necesario para detectar el primer error en la inspeccin de un
animal de arrastre, es una variable aleatoria que distribuye Normal con
media de 50 minutos y varianza 100 (min.)
2
. Si se inspecciona un animal
al azar. Cul es la probabilidad de que pase ms de una hora hasta que
se detecte el primer error?
Del planteamiento podemos deducir que:
= 50 min.
=100 (min.)
2
= 10 min.
x N(50;10)
[ ] [ ] 0.1587 8413 . 0 1 1 1
10
10
1
10
50 60
1 60 <
1
]
1

<
1
]
1


< > z p z p z p x p
Sol: - La probabilidad de que pase ms de una hora es de 15.87%
2 En un criadero se ha observado que el peso de un huevo, distribuye
normal con media 52 grs. y varianza 16 grs
2
.
Datos a considerar:
= 52 grs.
Prof: Natalia Henrquez 97
Prof: Natalia Henrquez
=16 grs.
2
= 4 grs.
x N(52;4)
a) Cual es la probabilidad de que al analizar un huevo, este pese
ms de 53 grs.?
[ ] 0.401 0.5987 - 1
4
1
1
4
52 53
1 53
1
]
1

<
1
]
1


< > z p z p x p
Sol: - La probabilidad es de 40.13%
3 Un Empleado se traslada diariamente de su casa a su oficina en el centro
de la ciudad. En trmino medio el viaje le toma 24 minutos con una
desviacin estndar de 38 minutos. Asuma que la distribucin de los
tiempos es aproximadamente Normal.
Datos a considerar:
= 24 min.
=38 min.
x N(24;38)
a) Si la hora de llagada a la oficina es 9:00 AM, y sale de su casa a las 8:30,
Cul es la probabilidad de llegar atrasado?
[ ] [ ] 0,4404 0.5596 - 1 0,1579 1
38
24 30
1 30 <
1
]
1


< > z p z p x p
Sol: - La probabilidad de llegar atrasado es del 44.04%.
b) El empleado quiere llegar atrasado a lo ms 5% de las veces, A que
hora le recomienda salir de su casa? Tarea.
4 El tiempo que tardan los canales de T.V., en realizar un enlace con
personas de gobierno para emitir un comunicado oficial, distribuye
normal con media 20 minutos y desviacin 5 minutos. Si se analiza el
tiempo de respuesta de un canal de televisin, cual es la probabilidad
normal, determine:
a) Menos de 25 minutos
[ ] [ ] 8413 . 0 1
5
20 25
25
min 5
min 20
<
1
]
1


< <

z P z P x P
u

Sol: - La probabilidad que sea menos de 25 minutos es aproximadamente a


las 84,13%.
b) Entre 15 y 25 minutos
Prof: Natalia Henrquez 98
Prof: Natalia Henrquez
[ ] [ ] [ ] [ ] [ ]
6826 . 0 1587 . 0 8413 . 0
1 1
5
20 15
5
20 25
15 25 25 15
min 5
min 20

< <
1
]
1


<
1
]
1


< < < < <

z P z P x P z P x P x P x P
u

Sol: - La probabilidad que sea entre 15 y 25 minutos es aproximadamente a


las 68,26%.
5 Una mquina almacena automticamente extracto de jugo de naranja
en botellas. Sin embargo, debido a variaciones (mltiples factores) el
llenado presenta oscilaciones. Observaciones realizadas durante un
largo periodo entregan una media de llenado u=160cc. Con una
desviacin estndar = 10cc. Si podemos asumir que el llenado sigue
una distribucin normal, determine:
a) La probabilidad que la maquina llene con ms de 170cc. Una botella
dada.
[ ] [ ] [ ] 1587 . 0 8413 . 0 1 1 1
10
160 170
1 170 1 170
10
160
<
1
]
1


< < >

z P z P x P x P
cc
cc u

Sol: - La probabilidad que llene con ms de 170cc. es aproximadamente a


las 15,87%.
b) Si los lmites para que una botella no sea reprocesada tiene que tener un
llenado entre 140 y 180cc. Qu porcentaje de la produccin deber ser
reprocesada?
[ ] [ ] [ ]
[ ] [ ] 9544 . 0 0228 . 0 9772 . 0 2 2
10
160 140
10
160 180
140 180 180 140
10
160
< <
1
]
1


<
1
]
1


< < < < <

z P z P
z P z P x P x P x P
cc
cc u

Sol: - La probabilidad que deber ser reprocesada es aproximadamente a


las 95,44%.
5 Cierta empresa telefnica asegura que el tiempo que hablan sus
usuarios de telefona celular, distribuye normal con media 50 minutos y
desviacin 20 minutos. La empresa que cuenta con 6.000 usuarios,
pretende entregar: $15 a cada usuario que hable como mnimo 70
minutos, $20 a los que hablen menos de 30 minutos y el resto, solo $10.
Cuanto gastara en total la empresa por esta curiosa poltica de
marketing:
Prof: Natalia Henrquez 99
Prof: Natalia Henrquez
a) Mnimo 70 min. b) Menos de 30 min.
[ ]
[ ]
[ ]
952 2 , 952
000 . 6 * 1587 . 0
1587 . 0
8413 . 0 1
1 1
20
50 70
1
70 1
70
1
1

>
1
]
1


>
>
>
n
n
x P
x P
x P
x P
6.000 n
-1.904a+b
4.096resto de usuario
Sol: - Lo que gastara la empresa en total es:
( 952 * 15) Usuarios como mnimo 70 minutos.
( 952 * 20) Usuarios menos de 30 minutos.
+ (4.096 * 10) Usuarios restantes.
= $ 74.280.-
EJERCICIOS VARIOS Y DE DISTRIBUCION NORMAL
1.En un examen final de matemticas la media fue 72 y la desviacin tpica de
15.
Determinar la referencias tipificadas de los estudiantes que obtuvieron
puntuaciones de:
a) 60 b)72 c)42 d)93 e)57 f)81.
2.Dos estudiantes fueron informados de que haban recibido referencias
tipificadas de 0.8 y 0.4 respectivamente, en un examen de ingls. Si sus
puntuaciones fueron de 88 y 64, respectivamente.
Hallar la media y desviacin tpica de las puntuaciones del examen.
( media=72, desv=20)
3.Hallar el rea bajo la curva normal en cada una de los siguientes casos:
a) entre z=0 y z=1.2
Prof: Natalia Henrquez 100
[ ]
[ ]
952 2 , 952
000 . 6 * 1587 . 0
1587 . 0
1
20
50 30
30
2
2

>
1
]
1


<
<
n
n
z P
z P
x P
000 . 6
20
50

n
u

Prof: Natalia Henrquez


b) entre z=-0.68 y z=0
c) entre z=-0.46 y z=2.21
d) entre z=0.81 y z=1.94
e) a la izquierda de z=-0.6
f) a la derecha de z=-1.28
g) a la derecha de z=2.05 y a la izquierda de z=-1.44.
4. La media de los pesos de 500 estudiantes de un cierto colegio es 151 lb y la
desviacin tpica de 15 lb. Suponiendo que los pesos se distribuyen
normalmente, hallar cuntos estudiantes pesan.
a) entre 120 y 155 lb.
b) ms de 185 lb.
c) menos de 128 lb.
d) 12 lb o menos.
5. Las puntuaciones de un ejercicio de biologa fueron 0,1,2,3,4,...,10,
dependiendo del nmero de respuestas correctas a 10 preguntas formuladas.
La puntuacin media fue 6.7 y la desviacin tpica 1.2, adems suponiendo
que las puntuaciones se distribuyen normalmente, determinar.
a) el porcentaje de estudiantes que consigui 6 puntos. (27%)
b) la puntuacin mxima del 10% ms bajo de la clase. (5.2)
c) la puntuacin del 10% superior de la clase.
(8.2)
6. La media de los dimetros interiores de una muestra de 200 arandelas
producidas por una mquina es 0.502 pulgadas y la desviacin tpica 0.005
pulgadas. El propsito para el que se destinan estas arandelas permite una
tolerancia mxima en el dimetro de 0.496 a 0.508 pulgadas, de otro modo, las
arandelas se consideran defectuosas. Determinar el porcentaje de arandelas
defectuosas producidas por la mquina, suponiendo que los dimetros se
distribuyen normalmente.
(23%)

7. Una familia desea planificar su grupo familiar y se ha propuesto tener 4
hijos, considerando todas las combinaciones posibles de tener 4 hijos y
considerando el orden de nacimiento y el sexo de ellos, obtener:
a) el espacio muestral de este evento.
b) la probabilidad de tener todos los hijos del mismo sexo.
c) la probabilidad de tener a lo ms 2 hombres.
8. Una empresa a lanzado 2 productos nuevos al mercado. Al realizar una
encuesta obtiene la siguiente informacin:
-El 20% prefiere slo el producto A.
-EL 55% prefiere el producto B
-El 5% prefiere ambos productos.
a) Calcular la probabilidad que no prefieran estos productos.
b) Calcular la probabilidad que prefieran slo un producto.
c) Si prefieren el producto A, cual es la probabilidad que prefieran el producto
Prof: Natalia Henrquez 101
Prof: Natalia Henrquez
9. Tres mquinas A,B,C producen respectivamente 60%, 30% y 10% del
nmero total de artculos de una fbrica. Los porcentajes de desperfectos de
produccin de estas mquinas son: 2%, 3%, y 4% respectivamente.
Calcular:
a) La probabilidad que un artculo elegido al azar sea defectuoso.
b) Si se selecciona un artculo y este no es defectuoso, cual es la probabilidad
que haya sido producido por la mquina A.
10. El 5% de las unidades producidas por una fbrica se encuentran
defectuosas, cuando el proceso se encuentra bajo control. Si el proceso se
encuentra fuera de control, se produce un 30% de unidades defectuosas. L a
probabilidad de que el proceso se encuentre bajo control es de 0.98.
Si se escoge aleatoriamente una unidad y se encuentra defectuosa, Cul es
la probabilidad de que el proceso se encuentre bajo control?
11. Un vendedor ha descubierto que la probabilidad de hacer varias ventas por
da, si visita 10 presuntos compradores se presenta en la siguiente tabla:

N de
ventas
1 2 3 4 5 6 7 8
P(x) 0.0
4
0.1
5
2k 0.25 0.19 k
2
k 0.02
a) Determinar la constante k para que p(x) sea funcin de probabilidad.
b) Calcule la cantidad media y su variacin del nmero de ventas por da.
c) Suponga que el vendedor obtiene una comisin de $1500 por venta,
determine su ganancia diaria esperada.
12. El nmero de artculos en mal estado en una caja para exportacin, es una
v.a X con la siguiente distribucin de probabilidad:

) 10 ( ) ( i A i X P
si i = 0,1,2,3,...,10.
a) Cul es la probabilidad que se encuentren menos de tres artculos en mal
estado, sabiendo que una caja tiene a lo ms 5 artculos en mal estado?.
b) Cul es el mero esperado de artculos en mal estado por caja?
13. Dentro del proceso productivo de una empresa en producto debe pasar por
tres etapas. En cada etapa ocupa la misma capacidad de tiempo de proceso.
La probabilidad de mantener una alta calidad en la primera, segunda y
tercera etapa es de 70%, 50% y 60% respectivamente. La probabilidad de
obtener una calidad mediana en los productos dentro de las etapas uno y tres
son del 20% y 40% respectivamente y la probabilidad de obtener una baja
calidad de produccin en la segunda etapa es de 25%.
a) Cul es la probabilidad de obtener un producto de mediana calidad?
b) Si el producto es alta calidad , Cul es la probabilidad que esta haya sido
aportada por la etapa uno?.
14. Demuestre que si A y B son sucesos independientes, entonces
C
A
y B
tambin lo son.
Prof: Natalia Henrquez 102
Prof: Natalia Henrquez
15.Una encuesta entrega informacin acerca de las alternativas de ahorro que
utilizan las personas:
40% prefiere las cuentas de ahorro bancarias.
39% prefiere los depsitos a plazo.
36% prefiere guardar el dinero en casa.
11% opta por las cuentas de ahorro y guardar el dinero en casa.
9% prefiere las cuentas de ahorro y los depsitos a plazo.
15% prefiere depsitos a plazo y guardar el dinero en casa.
6% prefiere slo las cuentas de ahorro y ahorrar en casa.
a) Construya un diagrama de venn para representar la informacin anterior.
b) Calcular la probabilidad que las personas prefieran otra alternativa de
ahorro.
c) Calcular la probabilidad que prefieran slo los depsitos a plazo.
d) Si prefieren ahorrar en casa, Cul es la probabilidad que abran una libreta
de ahorro?.
16. La media de los dimetros interiores de una muestra de 200 arandelas
producidas por una mquina es de 0.502 pulgadas y la desviacin tpica 0.005
pulgadas. El propsito para el que se destinan estas arandelas permite una
tolerancia mxima de o.496 a 0.508 pulgadas, de otro modo, las arandelas se
consideran defectuosas. Determinar el porcentaje de arandelas defectuosas
producidas por la mquina, suponiendo que los dimetros de distribuyen
normalmente.
17. Los depsitos efectuados en el banco A durante el mes de mayo ltimo
estn distribuidos normalmente, con media de $100000 y con una variabilidad
de ms menos $15000. Un depsito es seleccionado al azar, desde los
depsitos del mes en cuestin.
Encontrar la probabilidad de que el depsito sea:
a) menor o igual a $100000.
b) al menos $100000.
c) un valor entre $120000 y $150000.
d) mayor que $200000.
18. El tiempo de vida ( en das ) de un cierto tipo de lmpara es una variable
aleatoria T con distribucin exponencial(1/500).
Determine:
La vida media de este tipo de lmpara y la probabilidad que el tiempo de vida
sea mayor que el tiempo medio.
19. Un dado est viciado, de tal forma que la probabilidad de que aparezca un
cierto punto es proporcional a su valor. Calcular:
a) la probabilidad que sea un 5, sabiendo que el punto que sali es impar.
b) la probabilidad que aparezca un nmero par, sabiendo que sali un nmero
mayor que 3.
Prof: Natalia Henrquez 103
Prof: Natalia Henrquez
20. El tiempo que tardan los canales de T.V., en realizar un enlace con
personas del gobierno para emitir un comunicado oficial, distribuye normal
con media 20 minutos y desviacin 5 minutos. Si se analiza el tiempo de
respuesta de un canal de televisin, cul es la probabilidad que se demore
en realizar el enlace en:
a) Menos de 25 minutos.
b) Entre 15 y 25 minutos.
TRABAJO
1. Un fabricante desea comparar los tiempos de armado de cierto producto,
utilizando tanto el proceso de armado estndar como un nuevo proceso. Para
este propsito, se subdividieron los trabajadores de la empresa en dos grupos
con habilidades similares en cada uno de los grupos, asignndose uno de los
grupos a trabajar con el proceso estndar y el otro grupo a trabajar con el
nuevo proceso.
Luego de un tiempo de adaptacin, los resultados obtenidos se resumieron en
la siguiente tabla:
Nmero de trabajadores
Tiempo de armado
( segundos )
Proceso estndar | Proceso
nuevo
15 - 25 8 | 12
25 - 35
12 |
16
35 - 45
16 |
14
45 - 55
14 |
12
55 - 65
12 |
8
a) Cul es el tiempo de armado ms comn o frecuente en el proceso nuevo?
b) Cuntos trabajadores en total, demoran menos de 27 y ms de 60
segundos en el armado?
c) Si los trabajadores que utilizan el proceso nuevo incrementaran el tiempo de
armado en un 28% ms 3 segundos, y los del proceso estndar lo
incrementaran en slo 2 segundos. En qu proceso el tiempo de armado sera
ms homogneo?
2. Complete la tabla sabiendo que 08 . 6 x y que la amplitud del intervalo de
clase es constante.
Prof: Natalia Henrquez 104
Prof: Natalia Henrquez

Clases
i
x
i
n
i
N
i i
n x
1 3
3 5 20
5 - 180
90
10
Total
(
i
x
= marca de clase)
Calcule la a) mediana b) moda c)desviacin estndar.
3. Una seora tiene 13 amigos y amigas muy cercanos, de los cuales 6 son
mujeres.
a) De cuntas maneras puede invitar 7 ms de ellos a una fiesta?
b) De cuntas maneras puede invitar 7 o ms, de ellos si desea que al bailar
todos
tengan pareja? ( todos bailan ).
3. Una clase consta de 6 nias y 9 nios. Si se escogen 3 estudiantes al azar
para
conformar un comit, encontrar la probabilidad de que:
a) se seleccionen exactamente 2 nios
b) se seleccionen por lo menos, un nio
c) se seleccionen exactamente 2 nias.
5. a) Demuestre que: P(n,2)+P(n,3) = (n-1)P(n,2) donde
)! (
!
) , (
k n
n
k n P

b) Encontrar n si P (n,2)=20
6. Se dice que un sistema de ingeniera con n componentes es un sistema
k de n ( n k ) si el sistema funciona si y slo si k de la n componentes
funcionan. Suponga que todas las componentes funcionan en forma
independiente.
a) Si la componente i-sima funciona con probabilidad p para todo i. Calcule
la probabilidad que funcione un sistema 2 de 4.
b) Generalizar la probabilidad planteada en a).
Prof: Natalia Henrquez 105
Prof: Natalia Henrquez

Distribuciones
Conjuntas-Marginales y Condicionales
Prof: Natalia Henrquez 106
Prof: Natalia Henrquez
Distribuciones Conjuntas, marginales y condicionales
1. X variable aleatoria S X : , (cuantifica alguna caracterstica del espacio
muestral) y se define una medida para esta variable como [ ] 1 , 0 Re : cX p .
a) Si X es discreta se cumple:

1 ) ( 0 x p

1 ) (
Re

cX x
x p


a
RECX x
X
x p a X P a F a X F ) ( ) ( ) ( ) (
b) Si X es continua y cuya funcin de densidad de probabilidad es f(x)se
debe
cumplir:
f(x) debe ser mayor o igual que cero.

1 ) (
Re

cX x
dx x f



b
a
dx x f b x a P ) ( ) (

) ( ) ( ) ( a X P dx x f a X F
a


tal que F(x)=f(x)
Ejemplos:
1. Supongamos que la funcin de distribucin de la variable aleatoria X es:

'

>

n o s i
x x
x F
; 0
0 ; } e x p { 1
) (
Determine:
a) P(X>1) b) el valor esperado y varianza esperada.
Prof: Natalia Henrquez 107
Prof: Natalia Henrquez
2.

'

>

n o s i
x x
x F
; 0
0 ; } e x p { 1
) (
2
Determine:
a)


4
1
2
} exp{ 2 ) 1 ( ) 4 ( ) 4 1 ( dx x x F F X P
b)P(X>1)=1-F(1)=1-P(X<1)=
1
e
3. Ejemplo de Caso Discreto
Considere una v.a X con RecX={1,2,3} y sabemos que:
. 3 / 1 ) 2 ( , 2 / 1 ) 1 ( p p
Determine:
a) su funcin de distribucin de X.
b) Valor esperado.
c) Varianza.
d) La distribucin acumulada de X.
e) Grafique ambas funciones.
4. Supongamos que X es una v.a.c cuya f.d.p est dada por:

'

< <

p a r t e o t r a e n
x x x c
x f
, 0
2 0 ) ; 2 4 (
) (
2
a) Cul es el valor de c?
b) Encuentre P(X>1).
VARIABLES ALEATORIAS DISTRIBUIDAS CONJUNTAMENTE.
Con frecuencia en un experimento dado nos interesa no slo la funcin
distribucin de probabilidad de una variable aleatoria individual; si no tambin la
relacin entre dos o ms variables aleatorias. Por ejemplo, en un experimento sobre las
posibles causas del cncer pulmonar, tal vez nos interese la relacin entre el nmero
promedio de cigarros fumados por da y la edad a la cual la persona contrae el cncer ,
o un ingeniero puede interesarse por la relacin entre la resistencia al corte y el
dimetro de una soldadura de punto en un espcimen fabricado con hoja de acero.
Para especificar la relacin entre dos variables aleatorias se define la funcin de
distribucin de probabilidad acumulada conjunta de X e Y mediante:
) ; ( ) , (
,
y Y x X P y x F
Y X

De la funcin de distribucin conjunta
Y X
F
,
se puede obtener las distribuciones
Marginales
Y X
F y F de a siguiente manera:
i) Para el caso continuo.
Prof: Natalia Henrquez 108
Prof: Natalia Henrquez
) ; ( ) ; ( ) ( ) (
) , ( ) ; ( ) ( ) (
y F y Y X P y Y P y F
y x F Y x X P x X P x F
Y
X
< <
< <

y
x y
F
y x f

2
) , ( para el caso de dos variables, idem para n variables.
ii) Para el caso discreto.



i
j i j
j
j i i i i i i
y x p y Y p y y x p x X p y y Y x X P y x p ) ; ( ) ( ) ; ( ) ( ) ; ( ) ; (
Ejemplos:
1. Supongamos que en una encuesta a las familias se les hacen dos preguntas:
una sobre si son dueos o no de la casa y otra sobre su ingreso. Las posibles
respuestas y algunas probabilidades se presentan en lo que sigue:
A1: la familia es duea de la casa.
A2: la familia arrienda la casa.
B1: el ingreso familiar es menor de $150000.
B2: el ingreso familiar est entre $150000 y menos de $250000.
B3: el ingreso familiar es de $250000 o ms.
6 . 0 ) 2 / 1 ( 2 . 0 ) 3 / 1 ( 2 . 0 ) 1 / 1 ( 25 . 0 ) 2 ( 5 . 0 ) 1 ( , 3 . 0 ) 1 ( B A P B A P B A P B P B P A P
a) Encuentre la distribucin conjunta para estas dos variables.
b) Encuentre la probabilidad de que una familia sea duea de la casa y gane
$250000 o ms.
c) Encuentre la probabilidad de que dado que una familia es duea de la casa
gane menos de $150000.
Solucin:
. a)
B vs A A1
(duea)
A2 ( arrienda)
B1 0.1 0.4 0.5
B2 0.15 0.1 0.25
B3 0.05 0.2 0.25
0.3 0.7 1

Usando la definicin de probabilidad condicional, que equivale a la conjunta dividido
por la marginal respectiva se obtiene la tabla.
b) 05 . 0 ) 3 B 1 A ( P c) 3333 . 0 3 . 0 / 1 . 0 ) 1 dadoA 1 B ( P .
2.Suponga que se toma al azar3 bateras de un conjunto que consta de 3 bateras
nuevas, 4 usadas que todava funcionan y 5 son defectuosas. Si X e Y denotan
respectivamente el nmero de bateras nuevas y de bateras usadas que todava
Prof: Natalia Henrquez 109
Prof: Natalia Henrquez
funcionan, que fueron elegidas, determine a funcin de masa de probabilidad conjunta
de X e Y.
Prof: Natalia Henrquez 110
Prof: Natalia Henrquez

2 2 0 / 1
3
1 2
/
3
3
) 0 , 3 (
2 2 0 / 1 2
3
1 2
/
1
4
2
3
) 1 , 2 (
2 2 0 / 1 5
3
1 2
/
1
5
2
3
) 0 , 2 (
2 2 0 / 1 8
3
1 2
/
2
4
1
3
) 2 , 1 (
2 2 0 / 6 0
3
1 2
/
1
5
1
4
1
3
) 1 , 1 (
2 2 0 / 3 0
3
1 2
/
2
5
1
3
) 0 , 1 (
2 2 0 / 4
3
1 2
/
3
4
) 3 , 0 (
2 2 0 / 3 0
3
1 2
/
1
5
2
4
) 2 , 0 (
2 2 0 / 4 0
3
1 2
/
2
5
1
4
) 1 , 0 (
. 2 2 0 / 1 0
3
1 2
/
3
5
) 0 , 0 (

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

p
p
p
p
p
p
p
p
p
p
Prof: Natalia Henrquez 111
Prof: Natalia Henrquez
Luego a tabla de la distribucin conjunta es:
i-j 0 1 2 3 Total(margin
al)
0
1
2
3
Total
(Margina
l)
56/220 112/22
0
1
3. Ejemplo:
Suponga que 15% de las familias de cierta comunidad no tienen hijos, 20%
tienen 1, 35% tiene 2 y 30% tienen 3; considere adems que cada uno de los hijos
tiene la misma ( e independiente) posibilidad de ser nio o nia.
Si se elige al azar una familia de esta comunidad entonces B = el nmero de
nios
Y D = el nmero de nias, luego:

0875 . 0 ) 2 / 1 ( 35 . 0 ) hijos 2 / nias 2 ( P ) hijos 2 ( P ) ) total ( hijos 2 y nias 2 ( P ) 2 D ; 0 B ( P
1 . 0 2 / 1 2 . 0 ) hijo 1 / nia 1 ( P ) ) total ( hijo 1 y nia 1 ( P ) 1 D ; 0 B ( P
15 . 0 ) nio ningn ( P ) 0 D ; 0 B ( P
2



Tabla:
(B=i) vs ( D=j) 0 1 2 3 Total(marginal
)
P(B=I)
0 0.15 0.1 0.0875 0.375 0.35
1 0.1 0.175 0.115 0 0.3875
2 0.07
5
0.112
5
0 0 0.2
3 0.37
5
0 0 0 0.0375
Total (Marginal)
P(D=j)
0.37
5
0.387
5
0.2 0.0375 1
4. Ejemplo de caso continuo:

'

< < < <


~ , 0
y 0 , x 0 , e e 2
) y , x ( f
y 2 x
Calcule:
a) ) 1 Y , 1 X ( P < > , b) ) Y X ( P < , c) ) a X ( P <
Prof: Natalia Henrquez 112
Prof: Natalia Henrquez
Solucin:
a) P(X>1,Y<1)=
) e 1 ( e dxdy e e 2
2 1
1
0 1
y 2 x




b) P(X<Y)=

0
y
0
y 2 x
3 / 1 dxdy e e 2
c) P(X<a)=



a
0
a
0
y 2 x
e 1 dydx e e 2
Calcular la f.d.p de X.
d) P(Y<b)=
b 2
b
0 0
y 2 x
e 1 dxdy e e 2




.
Y demostrar que f(x,y) es una f.d.p de X,Y, es decir

0 0
y 2 x
1 dydx e e 2
Variables Independientes
Recuerdo: Si ) A ( P ) B / A ( P o ) B ( P ) A / B ( P o ) B ( P ) A ( P ) B A ( P
Conjunta

Implica que las variables X e Y son independientes si para cualquier conjuntos A y B de
nmeros reales:
) y ( f ) x ( f ) y , x ( f o
) b ( F ) a ( F ) b , a ( F o
) b Y ( P ) a X ( P ) b Y ; a X ( P o
) B Y ( P ) A X ( P ) B Y ; A X ( P
Y X Y , X
Y X Y , X




En el caso discreto p(x,y)=p(x)p(y)

) A X ( P ) B Y ( p ) x ( p ) y ( p ) B Y ; A X ( P
A X
X
B y
Y



Ejemplo:
Supongamos que X e Y son v.a independientes que tienen la misma f.d.p:
Prof: Natalia Henrquez 113
Prof: Natalia Henrquez

'

>

~ , 0
0 x , e
) x ( f
x
luego
) y x (
Y , X
e ) y , x ( f
+

Encuentre la f.d.p para la variable Y / X .


Solucin:
Determinemos
Y
X
F
en efecto:
1 a
1
1 dxdy e e ) aY X ( P a
Y
X
P ) a ( F
0
ay
0
y x
Y
X
+

,
_


Por lo tanto para encontrar f.d.p se debe derivar. Quedando:
2
Y
X
) a 1 (
1
) a ( ' F ) a ( f
+

Para a>0.
Conceptos de Esperanza de una variable aleatoria.
Sea
n
g : una funcin real valorada, donde ) ,..., , (
2 1 n
x x x g y
Ejemplo:

2 1 2 1
2 1 2 1
) , (
) , (
x x x x g
x x x x g
+

Definimos la esperanza de una funcin g como:

'

) ( ) (
) ( ) (
) ) ( (
3 2 1
x x
x x
x
p g
d x d x d x d x f g
g E
n
ya sea el caso continuo o caso discreto.
Propiedades y definiciones de esperanza y varianza:
1.
)) / ) ( ( ) ( ( )) ( ) ( ( y x g E y h E x h x g E
2. cov(x,y)=covarianza de X,Y= E(XY)-E(X)E(Y).
3. E(XY)=E(YE(X/Y))=E(XE(Y/X))
4. V(X+Y)=V(X)+V(Y)+2COV(X,Y)
5. V(X-Y)=V(X)+V(Y)-2COV(X,Y)
6. Si X,Y son independientes entonces
a) cov(x,y)=0
b) E(XY)=E(X)E(Y)
Prof: Natalia Henrquez 114
Prof: Natalia Henrquez
c) E(g(x)/y)=E(g(X))
7. Si
+ b x a Y
i i

entonces

b X E a Y E
x x a a X V a Y V
i i
j i j i i i
+
1
1
]
1


) ( ) (
) , cov( 2 ) ( ) (
2
8.
2 2
)) / ( ( ) / ( ) / ( Y X E Y X E Y X Var
9. ) ( ) (
tx
X
e E t M
10. Si

i
X Y e independientes entre ellas se tiene:
n
X X
x t
Y
I i
i
M t M e E t M ) ( ) ( ) ( ) (


Ejercicios
1. Una urna contiene 3 bolas numeradas 1, 2, 3 respectivamente. De la urna se
extraen dos bolas una a una sin reemplazo, y sea X el nmero de la primera
bola extrada, Y el nmero de la segunda bola. Hallar la distribucin de
probabilidad conjunta de la variable aleatoria (X,Y).
2. Si X representa el nmero de caras e Y el nmero de caras menos el de sellos
cuando se lanzan tres monedas de $100. Encuentre la distribucin de
probabilidad conjunta de X e Y.
Prof: Natalia Henrquez 115
Prof: Natalia Henrquez
3. Suponga que tres objetos no diferenciables se distribuyen al azar en tres celdas
numeradas. Sea X el nmero de celdas vacas e Y el nmero de objetos
colocados en la primera celda. Construya la tabla de distribucin de
probabilidad conjunta de X e Y. Son independientes dichas variables?.
4. Determine el valor de k de tal manera que la siguiente funcin represente una
funcin de probabilidad conjunta de la s v. a. X e Y:
P(x,y) = kxy, para x = 1, 2, 3 ; y =1, 2, 3
5. Se elige uno de los nmeros enteros: 1, 2, 3, 4, 5. despus de eliminar todos los
enteros (si los hay) menores que el elegido, se elige uno de los restantes (por
ejemplo, si el primer nmero es el 3, la segunda eleccin se hace de entre los
nmeros 3, 4, 5). Sea X e Y los nmeros obtenidos de la primera y segunda
eleccin respectivamente.
a) Hallar la distribucin de probabilidad conjunta.
b) Determine la distribucin de probabilidad marginal de X e Y.
c) Determine la distribucin de probabilidad condicional de Y, dado x = 3.
d) Determine la distribucin de probabilidad condicional de X, dado y = 3.
e) Calcular P[x + y > 7] y P[y x > 0]
6. La funcin de probabilidad conjunta de X e y est dada por:

1 0, ; 3 2, 1, 0, ,
32
) , (
2
2

+
y x
y
x
y x p
a) Hallar la funcin de probabilidad marginal de X e Y.
b) Determine la distribucin de probabilidad condicional de X, dado Y=y.
c) Determine la distribucin de probabilidad condicional de Y, dado X=x.
d) Calcular: p(x/1) ; p(x/2); p(x/3).
e) Calcular: p(y/1); p(y/2); p(y/3).
f) Verifique que X e Y son dependientes.
7. Hallar el valor de k, de tal manera que la funcin:

'

< <
c . o . c , 0

) , (
2 y 1 2 , x 0
y
x
k
y x f
Sea una funcin de densidad de una variable aleatoria (X,Y)
8. Dos variables aleatorias tienen la siguiente funcin de densidad conjunta:

'


c . o . c , 0
) , (
) , (
4 y 1 2 , x 0
2 2
y x k
y x f
a) Encuentre k.
b) Encuentre P(1<X<2,2<Y3)
c) P(1X2)
Prof: Natalia Henrquez 116
Prof: Natalia Henrquez
9. Sea (X,Y) una v.a. continua bidimensional con densidad:

'

< <
c . o . c , 0

1
) , (
1 x 0 , x y 0
x
y x f
Hallar las densidades marginales para X y para Y.
10. La cantidad de queroseno, en miles de litros, en un tanque al principio del da es
una cantidad aleatoria Y, de la cual una cantidad aleatoria X se vende durante
el da. Suponga que el tanque no se rellena durante el da, de tal forma que x
y , y suponga que la funcin de densidad conjunta de esta variables es:

'

< <
c . o . c 0
2
) , (
1 y 0 y , x 0
y x f
a) Determine si X e Y son independientes.
b) Encuentre P(1/4<X<1/2|Y=3/4)
11. Una distribucin de probabilidad conjunta de la variable aleatoria (X,Y) esta
dada por la siguiente tabla:
x
y
0 1
0 0.1 0.05
1 0.2 0.1
2 0.3 0.25
Calcular:
a) E(X) ; E(Y) b)E(3X+4Y) c)E(Y
2
) , V(Y) d)E(XY) e) P(X=1/Y=1) .
12. En el examen de admisin a cierta universidad se califica en base a 100 puntos.
Sea X la calificacin que obtiene un de los estudiantes (que contina
sus
estudios hasta graduarse) y se Y su razn del punto de calidad al graduarse
(4
puntos = A). La funcin de densidad conjunta de X e Y es:

'

< <
c . o . c 0

5 0
1
) , (
2 5 1 ) - 2 5 ( y , 4 2 y x y
y x f
a) Hallar E(X), E(Y), E(XY)
b) V(X) , V(Y) , cov(X,Y), (X,Y)
14. Sea X e Y v.a. continuas, cuya funcin de densidad conjunta es,
Prof: Natalia Henrquez 117
Prof: Natalia Henrquez

'

< <
c . o . c 0
4
) , (
4 / 1 y 0 1 , x 0
y x f
Son independientes las variables X e Y?.
15. La funcin de densidad conjunta de la variable aleatoria bidimensional (X,Y) es,

'


c . o . c 0
y ) - x - ( 6
) , (
4 y 2 , 2 x 0
8
1
y x f
Hallar las densidades condicionales f(x/y); f(y/x)
16. Una compaa tabacalera produce mezclas de tabaco de tal modo que cada una
contiene diferentes proporciones de tabacos turco, de la regin y otros. Las
proporciones de tabacos turco y del de la regin en una mezcla son variables
aleatorias con una funcin de densidad conjunta (X = turco y Y = regional):

'


c . o . c 0
2 4
) , (
1 y 0 1 , x 0 x y
y x f
a. Encuentre la probabilidad de que en una caja determinada el tabaco
turco sea ms de la mitad de la mezcla.
b. Encuentre la funcin de densidad marginal para la proporcin de tabaco
regional.
c. Encuentre la probabilidad de que la proporcin de tabaco turco sea
menor de 1/8 si se sabe que la mezcla contiene 3/4 de tabaco regional.
17. La distribucin de probabilidad conjunta de la variable aleatoria (X,Y) esta dada
por la tabla adjunta. calcular

a) E(X+Y)
b) E(XY)
c) E(2X+3/Y=2)
d) Cov(X,Y)
e) (X,Y)
Segunda etapa : para desarrollar estos ejercicios debe conocer distribuciones
especiales.
Prof: Natalia Henrquez
x
y
1 2
1 0.1 0.4
2 0.2 0.3
118
Prof: Natalia Henrquez
1. Sea

'

>


, 0
0 , ) , 1 ) ( 1 (
) , (
,
y x e e
y x F
y x
Y X

Encuentre:
a) la f.d.p de (X,Y).
b) las marginales de X e Y.
c) E(XY), E(X), E(Y),
) ( ), ( X Y E Y X E

d) X e Y son independientes ?
2. Sea

'

> + +

, 0
0 , 1 ) , (
) , (
,
y x y x y x c x
y x f
Y X
Determine:
a) c tal que f exista.
b) Rec X, Rec Y, Rec(X,Y).
c) F
X,Y
d) F
X
, F
Y.
e) E(X), E(Y).
3. X= Nmero de caras en tres lanzamientos de una moneda honesta.
Y= Nmero de sellos en los dos ltimos lanzamientos.
Sea
{ } 1 , 2 Y X B
.
Encuentre:
a) Rec ( X,Y), b) P
X,Y
(B) c) la conjunta.
4. Sea

'

+ +

, 0
1 ) , (
4
3
) , (
,
y x y x
y x f
Y X
Determine
a) Rec ( X,Y).
b) Sea { } 1 , 0 , : ) , ( + y x y x y x B encuentre P
X,Y
(B) .
c) Las marginales.
d) distribuyen en forma equivalente?.
e) son independientes ?.
Prof: Natalia Henrquez 119
Prof: Natalia Henrquez
5. Sea (X,Y) un vector aleatorio con f.d.p

'

< < < <

, 0
1 0 1 0 ,
) , (
,
x y c x y
y x f
Y X
Encuentre:
a) el valor de c.
b)
) 2 / ( X Y P
c)
( ) < < Y X Y X P 2
d)
< ) ( Y X P
e)
< ) 2 ( Y X P
f)
( ) < < Y X Y X P 2 ,
g)
) ( y x f
Y X
h) densidades de X e Y respectivamente.
f) son independientes ?
g) Rec ( X,Y)=Rec X *RecY.??
6. Sea (X,Y) vector aleatorio con f.d.p

'

> +

, 0
0 , 1 , 2 4
) , (
,
y x y x x y
y x f
Y X
Determine:
a) para z=x+y que

'

, 0
1 0 , 4
) (
3
z z
z g
b) Calcule directamente P(X+Yt) sin utilizar la densidad en a).
7. Sea (X,Y) un punto aleatorio con distribucin uniforme sobre el rectngulo
[ ] [ ] 1 , 0 1 , 0

y sea T el mximo entre las variables X e Y.
Hallar:
a) F
T
(t), b) Encuentre E(T). c) F
X
d) F
Y
e) E(X), E(Y).
8. Sea (X,Y) el resultado de escoger un punto al azar de la regin de R
2
acotado por las
rectas X=-1, Y=X+1, e Y=X-1.
Calcule:
a) las densidades marginales de X e Y respectivamente.
b)
) 0 ( > XY P
.
9. Si
i Exp X
i
), (
determine:
Prof: Natalia Henrquez 120
Prof: Natalia Henrquez
a) ) ( X E b) Si X
i
, Y
i
son independientes entonces ) ( X V .
c) cov(X
i
, Y
i
) .
d) E(X
i
* Y
i
)=
e) E(X
i

2
)=
10. X
1
,..., X
n
iid Bern(p).
Determine como distribuye la suma .
(Use funcin generadora de momentos ).
11. Si X,Y son iid ) , (
2
N entonces como distribuye:
a) X+Y b) X-Y c) (X+Y,X-Y).
12.Si X
1
,..., X
n
iid
) ( P
, 0 > . Cmo distribuye la suma?
13. Si
n i p n Bin X
i i
,..., 1 ), , (
, demuestre que la suma de binomiales es
binomial.
14. Sea

'

, 0
1 , 0 ) , 2 ( 2
) , (
,
y x x y y x
y x f
Y X
a) Muestre que las marginales distribuyen uniforme (0,1).
b) Muestre E(XY)=2/9
c) Muestre cov(X,Y)=-1/36
15. Sea (X,Y) vector aleatorio con densidad dada por

'

>

+
, 0
0 ,
) , (
) ( 2
,
y x e
y x f
y x
Y X

(compare con ejercicio 1)


a) Para 0 > , calcular
) ( X Y P
.
b) Calcular
) 2 ( X Y P <
.
16. Sean N fichas numeradas del 1 a la N.
Experimento
a) Se extrae una ficha al azar y X=nmero de la ficha.
b) Se lanza una moneda x veces Y=nmero de caras.
Determine:
a)
) ( x X y Y P
, b)
) ( x X P
,c) la f.d.p de (X,Y). d) E(X), E(Y). f) cov(X,Y).
Prof: Natalia Henrquez 121
Prof: Natalia Henrquez
17. Sea (X,Y) vector aleatorio con f.d.p f(x,y)=k(x-y).
. 1 0 x y
Esbozar la regin en la cual la densidad positiva y use esto para determinar los lmites de
integracin para responder.
a) la constante k.
b) Marginales de X e Y.
c) Distribucin condicional de X dado Y.
d) E l valor esperado de la variable aleatoria de c).
18. Suponga que el tiempo de vida de 2 componentes independientes distribuyen
exponencial T
1
, T
2
, con parmetros
y
, respectivamente. Encontrar.
a) > ) (
2 1
T T P b) > ) 2 (
2 1
T T P
19. Responda (V o F ):
a) Si X e Y son normales (y conjuntamente normales ) y cov(X,Y)=0 X e Y son
independientes.
b) Si X e Y son independientes cov(X,Y)=0 .
c) X e Y son normales X,Y normal bivariada.
20. Muestre las siguientes propiedades:
a) cov(X,Y)=cov(Y,X).
b) Cov(X,X)=Var(X).
c) Cov(X,c)=0
d) Cov(X, ax+b)=cov(ax+b,X)=a Var(X).
e) X e Y son v.a indep cov(X,Y)=0 ( en el otro sentido no es cierto ).
f)
) ( ) ( ) , cov( Y Var X Var Y X
, luego
1 ) , ( Y X
.
g) Para Y=aX+b determine

.
h) Qu significa

=1 ,

=-1 ?.
i) cov(Ax,by)=abcov(x,y).
21. Sea

'

> +

, 0
0 , 1 , 2
) , (
,
y x y x
y x f
Y X
Determine
a)
) ( y x f
Y X .
b) marginales respectivas.
c) valores esperados de X e Y respectivamente.
d) valor esperado de la condicional.
22. Si Z,W,Y son independientes entonces cov(w+z,w+y)=???
Prof: Natalia Henrquez 122
Prof: Natalia Henrquez
Distribucin de Poisson
La distribucin de Poisson es una distribucin de probabilidad discreta.
Expresa la probabilidad de un nmero de eventos ocurriendo en un
tiempo fijo si estos eventos ocurren con una tasa media conocida, y son
independientes del tiempo desde el ltimo evento.
La distribucin fue descubierta por Simon-Denis Poisson (17811840)
que public, junto con su teora de probabilidad, en 1838 en su trabajo
Recherches sur la probabilit des jugements en matires criminelles et
matire civile [Investigacin sobre la probabilidad de los juicios en
materias criminales y civiles].
Prof: Natalia Henrquez 123
Prof: Natalia Henrquez
Su distribucin de probabilidad est dada por:
donde
e es el base del logaritmo natural (e = 2.71828...),
k! es el factorial de k,
es un nmero real positivo, equivalente al nmero esperado de
ocurrencias durante un intervalo dado. Por ejemplo, si los eventos
ocurren de media cada 4 minutos, y ests interesado en el nmero
de eventos ocurriendo en un intervalo de 10 minutos, usaras
como modelo una distribucin de Poisson con = 2.5.
Por ejemplo, si 2% de los libros encuadernados en cierto taller tiene
encuadernacin defectuosa, obtener la probabilidad de que 5 de 400
libros encuadernados en este taller tengan encuadernaciones
defectuosas.
Su media y su varianza son:
Propiedades Reproductivas
Dadas n variables aleatorias X
i
, tales que:
todas tienen una distribucin de Poisson
cada una tiene su propio parmetro
i
(es decir, los lambda no
necesariamente tienen que ser iguales)
son todas independientes entre s
Prof: Natalia Henrquez 124
Prof: Natalia Henrquez
se toma la variable aleatoria
se toma
Entonces:
La variable aleatoria Y tiene una distribucin Poisson, con parmetro
Y
Es decir:
Dadas n variables de Poisson cualesquiera independientes, su suma es
tambin una variable de Poisson, cuyo parmetro vale la suma de los
parmetros de las variables originales.
Distribucin Exponencial
La distribucin exponencial es una distribucin de probabilidad continua
con un parmetro > 0 cuya funcin de densidad es
--Su funcin de distribucin es
Aqu e significa el nmero e.
El valor esperado y la varianza de una variable aleatoria X con
distribucin exponencial son
E[X] = 1 /
V(X) = 1 /
2

Ejemplos para la distribucin exponencial son los tiempos dentro
accidentes con probabilidad invariable.
La funcin de densidad para igual 0.5, 1.0, y 1.5:
Prof: Natalia Henrquez 125
Prof: Natalia Henrquez
Calcular variables aleatorias
Se pueden calcular una variable aleatoria de distribucin exponencial x
por medio de una variable aleatoria de distribucin uniforme u = U(0,1):
Relaciones
La suma de k variables aleatorias independientes de distribucin exponencial con
parmetro es una variable aleatoria de distribucin gamma.
Distribucin Gamma
Distribucin gamma.
La distribucin gamma es una distribucin de probabilidad continua con
dos parmetros k y cuya funcin de densidad para valores x > 0 es
Prof: Natalia Henrquez 126
Prof: Natalia Henrquez
Aqu e es el nmero e y es la funcin gamma.
Para valores la aquella es (k) = (k 1)! (el factorial de k
1). En este caso - por ejemplo para describir un proceso de Poisson
- se llaman la distribucin Erlang con un parmetro = 1 / .
El valor esperado y la varianza de una variable aleatoria X de
distribucin gamma son
E[X] = k / = k
V[X] = k /
2
= k
2

Relaciones
El tiempo hasta que el suceso nmero k ocurre en un Proceso de Poisson
de intensidad es una variable aleatoria con distribucin gamma. Eso es
la suma de k variables aleatorias independientes de distribucin
exponencial con parmetro .
Distribucin Beta
Distribucin beta.
La distribucin beta es una distribucin de probabilidad continua con dos
parmetros a y b
Prof: Natalia Henrquez 127
Prof: Natalia Henrquez
cuya funcin de densidad para valores 0 < x < 1 es
El valor esperado y la varianza de una variable aleatoria X con
distribucin Beta son
.
Un caso especial de la distribucin Beta con a = 1 y b = 1 es la
probabilidad uniforme
Distribucin Chi-Cuadrado
La distribucin Chi-Cuadrado, tambin denominada Chi-Cuadrado de
Pearson, es una distribucin de probabilidad continua con un parmetro
k que representa los grados de libertad de la variable aleatoria:
Donde Z
i
son variables de distribucin normal, de media cero y varianza
uno.
Esta distribucin se expresa habitualmente
Se suele usar la denominada prueba Chi-Cuadrado como test de
independencia y como test de bondad de ajuste.
La funcin de densidad Chi-Cuadrado es
donde y f
k
(x) = 0 para .
es la funcin gamma.
Prof: Natalia Henrquez 128
Prof: Natalia Henrquez
La funcin de distribucin es
donde (k,z) es la funcin gamma incompleta.
El valor esperado y la varianza de una variable aleatoria X con
distribucin Chi-Cuadrada son
E[X] = k
V[X] = 2k
La distribucin chi-cuadrado tiene muchas aplicaciones en inferencia
estadstica, por ejemplo en el test chi-cuadrado y en la estimacin de
varianzas. Tambin est involucrada en el problema de estimar la media
de una poblacin normalmente distribuida y en el problema de estimar
la pendiente de una recta de regresin lineal, a travs de su papel en la
distribucin t de Student, y participa en todos los problemas de anlisis
de varianza, por su papel en la distribucin F de Snedecor, que es la
distribucin del cociente de dos variables aleatorias de distribucin Chi-
Cuadrado e independientes
Relacin con otras distribuciones
La chi cuadrado es una distribucin binomial inversa cuyo coeficiente de
variabilidad es 10.1, esta tiene un intervalo de confianza de 2.3 grados
en la escala de desviaciones estndar. Posee una distribucin de Poisson
elevada la cual asciende a 56.5 m Eq en los tres primeros cuartiles de la
recta.
Para k = 2 la distribucin es una distribucin exponencial.
Distribucin t de Student
La distribucin-t o distribucin t de Student es una distribucin de
probabilidad que surge del problema de estimar la media de una
poblacin normalmente distribuida cuando el tamao de la muestra es
pequeo. Esta es la base del popular test de la t de Student para la
determinacin de las diferencias entre dos medias muestrales y para la
construccin del intervalo de confianza para la diferencia entre las
medias de dos poblaciones.
Prof: Natalia Henrquez 129
Prof: Natalia Henrquez
La distribucin t surge, en la mayora de los estudios estadsticos
prcticos, cuando la desviacin tpica de una poblacin se desconoce y
debe ser estimada a partir de los datos de una muestra.
Aparicin y especificaciones de la distribucin t de Student
Supongamos que X
1
, ..., X
n
son variables aleatorias independientes
distribuidas normalmente, con media y varianza
2
.
Sea
la media muestral y
la varianza muestral.
Entonces, est demostrado que
se distribuye segn una normal de media 0 y varianza 1. Gosset estudi
una expresin relacionada,
y mostr que T tiene la siguiente funcin de densidad:
Con igual a n 1.
La distribucin de T se llama ahora la distribucin-t
El parmetro se llama convencionalmente el nmero de grados de
libertad. La distribucin depende de , pero no de o ; la
independencia de y es lo que hace a la distribucin t tan importante
en la teora y en la prctica. es la funcin Gamma.
Prof: Natalia Henrquez 130
Prof: Natalia Henrquez
Intervalos de confianza derivados de la distribucin t de
Student
Supongamos que A es tal que
donde T sigue una distribucin t con n 1 grados de libertad (lo que
equivale a
por lo que A es el punto que determina el 95% de la probabilidad de la
distribucin).
Entonces
y esto es equivalente a
Por lo tanto, el intervalo cuyos extremos son
es un intervalo para al 90% de confianza. As, si encontramos que la
media de un conjunto de observaciones puede razonablemente seguir
una distribucin normal, podemos usar la distribucin t para examinar si
los lmites del intervalo incluyen algn valor predecible (tal como el valor
predicho en una hiptesis nula).
Es este resultado el que se utiliza en el test de Student: puesto que la
diferencia de las medias de muestras de dos distribuciones normales se
distribuye tambin normalmente, la distribucin t puede usarse para
examinar si esa diferencia puede razonablemente suponerse igual a
cero.
Prof: Natalia Henrquez 131
Prof: Natalia Henrquez
Inferencia
Intervalos de Confianza
Prof: Natalia Henrquez 132
Prof: Natalia Henrquez
Inferencia
Intervalo de Confianza
Como las estimaciones de punto rara vez sern iguales a los parmetros
que se supone estiman, por lo general es deseable darnos alguna libertad de accin
mediante el uso de estimaciones de intervalo, de la forma

< <
2 1

, donde

dependen del valor que toma el estimador

. Por ejemplo, si se nos pidiera


determinar el coeficiente intelectual promedio de un grupo de estudiantes muy grande,
sobre la base de una muestra aleatoria, podramos llegar a la estimacin de intervalo
117 109 < <
sobre la base de la media de la muestra 113 x , pues se cuenta con
informacin acerca de la distribucin muestral de x .
Como diferentes muestras generalmente producirn valores distintos de

, por
consiguiente, valores contrarios de

, estos puntos extremos del intervalo son


valores de v.a correspondientes

. Por tanto basados en la distribucin muestral


de

podemos afirmar con una probabilidad dada que este intervalo contendr en
realidad el parmetro que se supone que estima. En otras palabras, podemos utilizar la
distribucin muestral de

para elegir

, tal que para cualquier probabilidad


especfica 1 , donde , 1 0 < <
< <

1 ) (
2 1
P
. El intervalo anterior recibe el
nombre de intervalo de confianza de ( 1 )100% , la fraccin de 1 se conoce
como coeficiente de confianza o grado de confianza y los extremos como lmites de
confianza.
1.1 Intervalo de confianza para medias.
Prof: Natalia Henrquez 133
Prof: Natalia Henrquez
Teoremas
a)Intervalo de Confianza para
2
y conocida.
Si x es el valor de la media de una muestra aleatoria de tamao n tomada de
una poblacin normal con la varianza conocida, un intervalo de confianza de (1-
).100% para est dado por:
n
z x

.
2 /
t
.
Asimismo, en virtud del teorema del lmite Central, este resultado se puede
utilizar para muestras aleatorias tomadas de poblaciones no normales con la varianza
conocida
2

, siempre que n sea lo suficientemente grande; es decir 30 n .


Ejemplo.
Mediciones de la presin sangunea de 25 mujeres de edad avanzada tienen una
media de x =140 mm de mercurio. Si estos datos se pueden considerar como una
muestra tomada al azar de una poblacin normal con 10 mm de mercurio,
construya un intervalo de confianza de 95% de la media de la poblacin

.
Solucin:
Datos: mm x mm n 140 , 10 , 25 96 . 1
975 . 0
z por lo tanto el
intervalo de confianza para la media poblacional con varianza conocida es :
] [ 92 . 143 ; 08 . 136
25
10 96 . 1
140

t
Con una probabilidad del 95%.
b) Intervalo de confianza para la media poblacional con varianza desconocida
est dado por:
n
s
t x .
2 /
t
. Donde S es la desviacin estndar muestral.
1
) (
1
2

n
x x
s
n
i
i
Ejemplo de estimacin de media con varianza desconocida.
En un estudio sobre el nivel de aprendizaje en empleados de una planta obtenido
con un nuevo sistema de trabajo, de un total de 36, se aplic el sistema a 9 de estos,
cuyas evaluaciones entregaron los siguientes puntajes: 150; 148.1 ;150.4 ; 147.3 ;
150.2; 152.5; 150.8; 153. Haciendo los supuestos que estime necesarios:
Construya un intervalo de confianza al 95% para la estimacin media del puntaje
del nuevo sistema de trabajo.
Solucin:
484 . 0 23 . 150 : ) ( IC
3060 . 2 ) 8 ( t 975 . 0
2
1 63 . 0 S 23 . 150 x
975 . 0 n
t


Por lo tanto el puntaje promedio poblacional est entre : 149.746 y 150.714
con una probabilidad del 95%.
Prof: Natalia Henrquez 134
Prof: Natalia Henrquez
El error de estimacin con varianza conocida est dado por:
n
z
e
2 / 1


Luego para calcular el tamao muestral necesario para tener un error fijo, se despeja
n.
1.2Intervalo de confianza para diferencia de medias: ( dos casos )
Si
2 1
x y x son las medias de m.a. independientes de tamao
2 1
n y n
tomadas de poblaciones normales que tienen las medias,
2 1
y y las varianzas
2 1
2 2
y
, entonces
2 1
x x es una variable aleatoria que tiene una
distribucin normal con media 2 1
2 1

x x
y la varianza para la diferencia de
medias est dada por:
2
2
1
2
2 2 1
n n

+
y adems tiene distribucin normal ( suma de
variables normales independientes es normal ) luego:
a)El intervalo de confianza para la diferencia de medias con varianzas
conocidas es:


2 1
x x
t z
/2
2
2
1
2
2 1
n n

+
Nota: Recuerde que
2 / 1 2 /
z z
.
Ejemplo:
Construya un intervalo de confianza del 94% de la diferencia real entre las
duraciones en promedio de dos tipos de focos elctricos, dado que una muestra
tomada al azar de 40 focos de un tipo dur en promedio 418 hrs. de uso continuo y 50
focos de otra clase duraron en promedio 402 hrs. Las desviaciones estndar de las
poblaciones, segn se sabe, son . 22 26
2 1
y
Solucin: Para 06 . 0 , tenemos a partir de la tabla 88 . 1
97 . 0
z , por tanto el
intervalo de confianza del 94% de 7 . 25 3 . 6
2 1 2 1
< < es .
Por consiguiente, tenemos 94% de confianza en que el intervalo de 6.3 a 25.7
contiene la diferencia verdadera entre las duraciones en promedio de los dos tipos de
foco. El hecho que el intervalo sea positivo, nos indica que la duracin media del
primer tipo de foco es superior a la del segundo tipo.
b) Intervalo de confianza para diferencia de medias con varianzas
desconocidas pero iguales es decir
2 1
, est dado por :
Prof: Natalia Henrquez 135
Prof: Natalia Henrquez
2 1
x x
t t1- /2(n1+n2-2) Sp
2 1
1 1
n n
+
.

Ejemplo:
1.Se ha realizado un estudio para comparar el contenido de nicotina de dos
marcas de cigarrillos. Diez cigarrillos de la marca A tuvieron en promedio un contenido
de nicotina de 3.1 miligramos con una desviacin estndar de 0.5 miligramos, mientras
que otros diez cigarrillo de marca B tuvieron en promedio un contenido de nicotina de
2.7 miligramos con una desviacin estndar de 0.7 miligramos. Suponiendo que los dos
conjuntos de datos son muestras tomadas al azar de poblaciones normales con
varianzas iguales, construya un intervalo de confianza del 95% de la diferencia real en
el contenido promedio de nicotina de las dos marcas de cigarrillos.
Solucin:
Resumen de los datos:
Marca A Marca B
10
1
n 10
2
n
1 . 3
1
x 7 . 2
1
x
S1=0.5 S2=0.7
Aqu se ocupa la varianza ponderada es decir SP
Informacin deducida de los datos:
. 447 . 0
10
1
10
1
, 1009 . 2 ) 18 ( , 608 . 0 , 37 . 0
975 . 0
2
+ t S S
P
P
Luego el intervalo
de confianza para la diferencia de medias con varianzas desconocidas pero iguales
est dado por:
] [ 97 . 0 ; 17 . 0 , la diferencia de medias reales se encuentra entre 0.17 y 0.97 con un
95% de probabilidad.
Ejemplo 2.
Para estas fiestas Patrias en cierta empresa, se debe elegir el lugar en
que se adquirirn los insumos correspondientes a las actividades de
festejo que se realizarn. Para esto se evaluaron los presupuestos,
obtenindose: del primer distribuidor un precio promedio de $253000
con una desviacin de $ 20000, mientras que con el segundo distribuidor
se obtuvo un precio medio de $270000 con una desviacin de $35000.
En el supuesto de que los precios de los insumos distribuyen normal con
igualdad de varianzas. Determine a partir de una confianza del 90% si
conviene comprar los insumos con el primer distribuidor. Explique el
porque de su respuesta.
( en ambos casos se tomo una muestra de 22 productos ).
Solucin:
Distribuidor 1 Distribuidor 2
Precio medio 253000 270000
Prof: Natalia Henrquez 136
Prof: Natalia Henrquez
Des.est. 20000 35000
Nmero de
productos
22 22
Los valor que se obtienen son los siguientes:
65 . 1 z ) 42 ( t , 95 . 0
2
1 , 3015 . 0
22
1
22
1
, 3 . 28504 S
95 . 0 95 . 0 p

+
Por lo tanto el IC de la diferencia de medias queda:
] [ 82 . 2819 ; 18 . 31180 18 . 14180 17000 : ) ( IC
2 1
t
Criterio para concluir usando el IC.
a) ) ( IC
2 1
<0 se tiene que la media 1 es menor que la media 2.
b) ) ( IC
2 1
>0 se tiene que la media 1 es mayor que la media 2.
c) ) ( IC
2 1
=0 se tiene que no hay diferencia de medias, bajo las
condiciones dadas.
En el caso del ejemplo conviene comprarle al distribuidor 1.
Ejemplos varios de medias:
1.Durante varios aos, se haba aplicado una prueba de nivel de matemticas a
todos los alumnos de primer ingreso de cierta universidad. Si 64 estudiantes,
seleccionados al azar en este periodo, tardaron en promedio 28.5 minutos en resolver
la prueba con una varianza de 9.3 minutos, construya un intervalo de confianza de
99% del tiempo promedio verdadero que tard un alumno de primer ingreso en
resolver el examen.
Solucin:
979 . 0 5 . 28 : ) (
57 . 2 ) 63 ( 995 . 0
2
1 min 3 . 9 5 . 28
995 . 0 995 . 0
2 2
t

IC
z t S x n
Por lo tanto la media de tiempo en resolver el examen se encuentra entre 27.521 y
29.479 con una probabilidad del 99%.
2.Una muestra de 12 comerciales de cierto canal de T.V, dieron una duracin
promedio de11,9 segs, con una desviacin de 0,9 segs. En otro canal, 10 comerciales
presentaron una duracin promedio de 1,3 segundos, con una desviacin de 0,8
segundos.
Con una significacin del 5%, Podra Ud. Afirmar que no existe diferencia
significativa entre las duraciones medias de los comerciales en ambos canales?.
Solucin:
Canal A Canal B
12
2
n 10
2
n
9 . 11
1
x 3 . 12
1
x
Prof: Natalia Henrquez 137
Prof: Natalia Henrquez
S1=0.9seg S2=0.8seg
0860 . 2 ) 20 ( , 975 . 0
2
1 , 428 . 0
10
1
12
1
, 856 . 0
975 . 0
+ t S
p

Por lo tanto el IC de la diferencia de medias queda:
] [ 364 . 0 ; 1647 . 1 764 . 0 4 . 0 : ) (
2 1
t IC
Bajo los criterios antes mencionados no hay diferencia de medias.
3.Cierto profesor de Estadstica desea estimar la nota promedio que alcanzaron
los alumnos, para lo cual tom una muestra aleatoria que arroj las siguientes notas:
2; 3; 4; 1; 1.5; 2.3; 2.7; 3; 6. Total 9 notas. Efecte un intervalo de confianza al
95% y al 98% para estimar la nota media de esta prueba.
Solucin:
12 . 1 8 . 2 : ) (
3060 . 2 ) 8 ( 975 . 0
2
1 48 . 1 8 . 2
975 . 0
t

IC
t S x
n
con una probabilidad del 95% y
41 . 1 8 . 2 : ) (
8965 . 2 ) 8 ( 99 . 0
2
1 48 . 1 8 . 2
99 . 0
t

IC
t S x
n
con una probabilidad del 98%.
1.3 Intervalos de confianza para proporciones:
Existen muchos problemas en los cuales debemos obtener ya sea proporciones
o probabilidades o ndices (tambin llamados tasas, por ejemplo ,la proporcin de
unidades defectuosas en un cargamento grande de transistores, o bien, la probabilidad
que un automvil detenido en una inspeccin tendr las luces descompuestas, o el
porcentaje de alumnos con coeficiente intelectual arriba de 115,o incluso el ndice o
tasa de mortandad que provoca una enfermedad, etc. En muchos de estos casos es
razonable suponer que se muestrea una poblacin binomial y, por consiguiente, que
nuestro problema consiste en determinar el parmetro binomial,p.
Utilizamos este hecho de que para valores grandes den a distribucin
binomial puede obtenerse aproximadamente con una distribucin normal, es decir, que
la variable aleatoria:
) 1 ( p np
np x
z

luego el intervalo de confianza est dado por:


i) Intervalo de confianza de muestras grandes para p.
n
) p 1 ( p
z p
2
1

t
Ejemplo:
Prof: Natalia Henrquez 138
Prof: Natalia Henrquez
Se hace un estudio para determinar la proporcin de votantes de una
comunidad cuantificable que favorecen la construccin de una planta generadora de
energa nuclear. Si se tiene que slo 140 de 400 votantes seleccionados al azar
favorecen el proyecto, obtenga un intervalo de confianza de 95% de la proporcin de
todos los votantes de esta comunidad que se expresan a favor del proyecto.
Solucin: Al sustituir

p
=140/400 y z1-0.025=1.96, el intervalo de confianza se
reduce a : 0.303<p<0.397.
ii) Intervalo de confianza para diferencia de proporciones.
Frecuentemente surgen problemas donde es preferible calcular la
diferencia entre los parmetros binomiales p1 y p2 sobre la base de muestras aleatorias
independientes tomadas de dos poblaciones binomiales. En este caso, por ejemplo
deseamos estimar la diferencia entre las proporciones de votantes de dos distritos
diferentes que se expresan a favor del candidato X para que sea electo senador.
Si los nmeros de aciertos respectivos son x1 y x2 y las proporciones de la
muestra correspondientes son:
2
2
1
1
2
,
1
n
x
y
n
x
p p

, investigaremos la
distribucin muestral de
2 1
p p

Como un estimador potencial de


2 1
p p
. Luego para muestras grandes un
intervalo de confianza para la diferencia de proporciones est dado por:
2 1
2 / 1
)
2
1 (
2
)
1
1 (
1
2 1
n n
z
p p p p
p p

t

Ejemplo: Si se tiene que 132 de 200 votantes del distrito A favorecen a un candidato
dado para la eleccin del senado y 90 de 150 votantes del distrito B se expresan a
favor de este mismo candidato, obtenga un intervalo de confianza para la diferencia de
proporciones reales al 99% de los votantes de los dos distritos favorables al candidato.
Solucin: Al sustituir
575 . 2 ,
150
90
2
,
200
132
1
995 . 0


z p p
, el intervalo de
confianza para la diferencia real de proporciones est entre: -0.074 y 0.194.
Ejercicios
Prof: Natalia Henrquez 139
Prof: Natalia Henrquez
1. Usted colocar una Agencia de Publicidad propia, si al realizar un estudio en el
mercado adecuado, sobre el 70% de los encuestados estn dispuestos a
trabajar con usted. Para esto, usted toma 1120 encuestas registrando en ellas
que 39 no se cambiaran con usted. Considerando un 2% de significacin,
Pondr usted su agencia de Publicidad propia?.
2. Un ingeniero agrnomo analiz 12 granos de uva de la lnea SAEM,
encontrando un valor promedio en el peso de ellas de 30 grs. Su colega ,
concluy que el peso medio est bien, a que cuando realiz su propio muestreo
en 20 granos del mismo tipo de uvas, encontr el mismo valor promedio. Cree
Ud. que el segundo ingeniero a fundamentado estadsticamente en forma
correcta su decisin. Justifique detalladamente su respuesta.
3. Una empresa de publicidad ha aplicado un comercial con el fin de lograr
uniformidad en la ventas de cierto producto de lunes a viernes. Para evaluar
esto se toma registros obtenindose las siguientes ventas:
Da Lunes Martes Mircoles Jueves Viernes
Ventas del producto
( cantidad )
150 179 209 120 213
A partir de estos valores, Puede usted afirmar que las ventas en la semana
son iguales? Use = 5%. ( test de homogeneidad ).
4. Un inspector de alimentos, que examina 12 frascos de cierta
marca que contienen mantequilla de cacahuate(man) obtuvo los
siguientes porcentajes de impurezas:
2.3-1.9-2.1-2.8-2.3-3.6-1.4-1.8-2.1-3.2-2.0 y 1.9.
Suponiendo que estas determinaciones estn normalmente distribuidas,
construya un intervalo de confianza de 99% del porcentaje promedio de
impurezas que hay en esta marca de mantequilla de cacahuate.
5. Suponga que por experiencia se sabe que la desviacin estndar del peso de
paquetes de galletas de 8 onzas hechas por cierta pastelera es de 0.16 onzas.
Para cerciorarse que la produccin esta bajo control en un da dado, es decir
para verificar si el peso promedio real de los paquetes es de 8 onzas, se
selecciona una muestra al azar de 25 paquetes y se encuentra que su peso
medio es 8.112 onzas. Como la pastelera espera perder dinero cuando 8 > ,
pruebe la hiptesis nula , 8 contra la hiptesis alternativa 8 con
01 . 0 .
6. Si una muestra aleatoria de tamao n=20 tomada al azar de una poblacin
normal con varianza conocida de
225
2

,tiene una media de 64.3 construya un
intervalo de confianza del 95% para la media poblacional.
7. Un fabricante de pintura desea determinar el tiempo de secado en promedio de
una nueva pintura para interiores. Si en 12 reas de prueba de igual tamao el obtuvo
Prof: Natalia Henrquez 140
Prof: Natalia Henrquez
un tiempo de secado medio de 66.3 minutos y una desviacin estndar de 8.4 minutos,
construya un intervalo de confianza de un 95% para la media poblacional.
8. El departamento de seguridad de una fbrica desea saber si el tiempo promedio
real que requiere el velador para realizar su ronda nocturna es de 30 minutos. Si en
una muestra al azar de 32 rondas, el velador promedi 30.8 minutos con una
desviacin estndar de 1.5 minutos, determine con 01 . 0 si esta es evidencia
suficiente para rechazar la hiptesis nula 30 minutos a favor de la hiptesis
alternativa 30 minutos.
9. Cinco mediciones del contenido de alquitrn de cierto tipo de cigarrillo arrojaron
los siguientes resultados: 14.5, 14.2, 14.4, 14.3 y 14.6 mg/cig. Demuestre que para
05 . 0 se debe rechazar la hiptesis nula, 0 . 14 a favor de la hiptesis
alternativa 0 . 14 . Suponga que los datos son una muestra tomada al azar de una
poblacin normal.
10. Se realiz un estudio de muestra del nmero de almuerzos empresariales que
los ejecutivos declaran como gastos deducibles por mes. Si 40 ejecutivos de la
industria de seguros observaron un promedio de 9.1 de estas deducciones con una
desviacin estndar de 1.9 en un mes dado, mientras que 50 ejecutivos bancarios
promediaron 8.0 con una desviacin estndar de 2.1. pruebe la hiptesis nula
0
2 1
contra la hiptesis alternativa, 0
2 1
en el nivel de significancia
05 . 0 .
11. En una muestra aleatoria de 200 personas que no se desayunaron, 82
informaron que experimentaron una fatiga a media maana y en una muestra aleatoria
de 400 personas que s se desayunaron, 116 reportaron que experimentaron fatiga a
media maana. Con un nivel de significancia 05 . 0 pruebe la hiptesis nula de que
no hay diferencias entre las proporciones de la poblacin correspondiente contra al
alternativa de que la fatiga a media maana prevalece ms entre personas que no se
desayunaron.

Prof: Natalia Henrquez 141
Prof: Natalia Henrquez
Determinacin de tamao de muestra
Determinar el tamao de muestra necesario para poder afirmar con una confianza del
% 100 ) 1 ( para que el error cometido en la estimacin de N , en valor absoluto es a
lo sumo .

2
2
2
2
2
2
2
1
1 ) (
1
1
1
1
1 ) (

,
_

,
_

,
_

,
_

,
_

x
x
X
X
X
X
X X
X X
Z
n
Z
n
Z
Z P
Z P
Z P
X
P
X
P
X P
Entre las 19 y 20 hrs en la carretera un sbado carabineros control a 64 autos y
verific que la velocidad promedio fue de 60 millas/ hr y se sabe que la desv.estndar
es de 15 millas/hr. Determine un I.C del 95% para la veloc promedio de los autos que
circulan en esta carretera en estos das y horas especificados.
Solucin.
64 autos, 05 . 0 / 15 / 60 hr millas hr millas v
] [ 675 . 63 ; 325 . 56 96 . 1 z
el tamao del intervalo (2 veces el error ) est dado por:
n
z z L L
x
x i s




2
1
2
1
2 2
Calcular n para obtener una confianza del 95% para que el error cometido en
la estimacin sea de 3 millas/hr.
96 . 1 % 5
025 . 0 2 /
z z

, =3.
15 , 96
3
15 96 . 1
2
2
2

,
_

,
_

x
Z
n
Prof: Natalia Henrquez 142
Prof: Natalia Henrquez
Una muestra de 12 medidas de resistencia a la rotura de hebras de algodn dio una
media de 7.38 onzas y una desv.estndar de 1.24 onzas. Construya lmites de
confianza del 95% para la resistencia media.
Solucin: se ocupa 201 . 2 ) 11 ; 2 / ( ) 1 ; 2 / ( ) 1 ; 2 / 1 ( t n t n t
El I.C. es 7.38t 2.2010.36.
Suponga X N( ,
2
), .Una muestra de tamao 25 da la siguiente informacin:
165000 , 700
25
1
2
25
1


i
i
i
i x
x encontrar un intervalo de confianza del 95% para la
media.
Solucin: 26 . 76 , 5816 28 6600 ) ( , 6600 , 28
2 2

x
x v x x
Por lo tanto el I.C es : 28t 1.9676.26/5.
El gerente de cierto Banco, desea determinar la cantidad promedio que depositan sus
clientes en cuentas de ahorro, la =$400.
a) Qu tamao de muestra se requerir para asegurar con un nivel de confianza del
95% tal que el error cometido no sea mayor de $20.?
b) Qu tamao de muestra ser necesario para asegurar con un nivel de confianza
del 95% que el error cometido en la estimacin no exceda a $40.
c) Compare los tamaos de muestra ( compare con los errores, es decir a mayor
muestra menor error).
Solucin:
b a b a
n n n n > , 384
40
) 400 ( ) 96 . 1 (
, 1537
20
) 400 ( ) 96 . 1 (
2
2 2
2
2 2
.
Conviene error menor.

HIPTESIS
Docimacia de hiptesis : Consiste en determinar la probabilidad de ocurrencia del
resultado obtenido en una muestra, basndose en la distribucin de la muestral de la
estadstica usada para medir tal resultado.
Hiptesis Estadstica : Es una suposicin sobre una poblacin ( valor de los
parmetros, forma de la distribucin ) la cual puede ser probada ( docimada ) en base
a la muestra extrada de esa poblacin.
EJ: Si la poblacin es un conjunto de alumnos brillantes se podra tomar como
hiptesis que

es el coeficiente intelectual promedio es mayor que 120.


Definicin: Si la hiptesis Estadstica especfica completamente el valor del o de los
Parmetros y la forma de la distribucin de probabilidad entonces diremos que es una
hiptesis simple en caso contrario diremos que es una hiptesis compuesta.
Ej: X N( ,1), con =0.8 es hip. simple, con <0.8, o >0.8 es hip. Compuesta.
Definicin : La hiptesis Principal la cual se desea docimar es deniminada hipteisi
nula y se simboliza H0 , otra hiptesis es la alternativa ( contrastar ) es Ha. En la
Prof: Natalia Henrquez 143
Prof: Natalia Henrquez
hiptesis nula, todo sigue igual no hay cambio, la de la alternativa es la del
investigador ( ojo).
Ej: H0 : = 30 kilos ( peso promedio de nios de cuarto bsico ) v/s
Ha: 30 kilos , o < 30, o > 30.
Para docimar hiptesis se toma una muestra.
EJ: lanzar una moneda, y determinar la probabilidad que salga cara.
H0 : p = v/s Ha: p 1/2 moneda normal ?
Para esto se toma una muestra de tamao 10 ( lanzamientos ), se espera obtener 5
caras en los 10 lanzamientos, puede ocurrir que en la muestra no me salga ninguna
cara o todas ( es por esto que mientras ms grande sea la muestra mejor inferencia se
puede desarrollar ) cundo es fiable la muestra ?.
Un criterio para rechazar H0 podra ser P( p = ) 0.05
p: puede ser un promedio, una varianza ,..., etc
Decisin para H 0
cierta falsa
No rechazar OK MAL
rechazar MAL OK
Error tipo I : es rechazar H0 cuando H0 es cierta.
Error tipo II: no rechazar o aceptar H0 cuando H0 es falsa.
P( error tipo I ) =
P( error tipo II) =
Suponga que un antroplogo tiene 9 mediciones de crneos de una tribu prehistrica,
estos crneos pueden provenir de una tribu A o una tribu B.
Se sabe que A = 20 , B = 24 y
2
=16. Adems la distribucin de estos crneos
es normal X N( ,16). D que tribu provienen los crneos? Considere =0.05.
Hacer dibujo (20+24)/2 = 22
H0 : = 20 v/s Ha : = 24>20, =0.05.
) , ( ,
2
2

X
N
n
N X

,
_


) 1 , 0 ( N
n
x
z


Bajo H0 ( = 20 ) 5 . 1
3 / 4
20 22
3 / 4
20

x
z
cal
( hacer dibujo de regin critica, se
ubica z de tabla y a la derecha de el regin de rechazo y a la izquierda de el regin de
aceptacin)

RC={ }

>
1
/ z z z z
tabla
region crtica
Prof: Natalia Henrquez 144
Prof: Natalia Henrquez
65 . 1
95 . 0
z z

luego se rechaza H0 si
tabla calc
z z > , como 1.5 >1.65 es falso se
tiene que NO se rechaza H0 ,luego aceptamos la hiptesis nula ( en forma rigurosa se
dice que no existe evidencia para rechazar la hiptesis nula ).
Ahora calculemos probabilidad del error tipo II, es decir .
Encontrar ZCRITICO =Zc tal que P( Z )
CRITICO
Z .
Zc = 65 . 1
3 / 4
20

c
x
se tiene 2 , 22
c
x se tiene RC={ } 65 . 1 / >
tabla
z z z
RC={ } 2 . 22 / > x x luego = P( Z ) 65 . 1 P( x
) 2 . 22 .

089 . 0 ) 35 . 1 ( 35 . 1
3 / 4
24 2 . 22
) 24 / 2 , 22 (

'

Z P
x
P x P
x


Error tipo II. ( Aprox el 9%).
Modelo de Regresin Lineal
Idea de Regresin
Prof: Natalia Henrquez 145
El objetivo de este captulo es que el alumno conozca el
concepto de relacin entre dos variables, adems de ser capaz de
encontrar tal relacin con el fin de predecir una de ellas en funcin
de la otra.
Prof: Natalia Henrquez
Lineal simple:
Consideremos n puntos en un plano cartesiano (X,Y), digamos (x
1
,y
1
), (x
2
,y
2
),
(x
3
,y
3
), . . ., (x
n
,y
n
), la idea geomtrica de regresin lineal, es encontrar una recta de
la forma
x
y
1 0


+
, que pase lo ms cerca de los n puntos anteriores, es
decir, la distancia entre estos puntos a la recta sean lo ms pequeo posible.
Si definimos como e
1
, e
2
, e
3
,. . .,e
n
, a estas distancias, podemos escribir la funcin
como

y
i
=+x
i
+e
i
, i=1,2,3, . . . ,n.

Los parmetros de regresin
0

,
1

son conocidos como intercepto y pendiente


respectivamente.
La estimaciones
1
;
0


de
0

,
1

que se obtienen al minimizar la


suma de los cuadrados de las distancias, son llamados estimaciones del mtodo de los
mnimos cuadrados ordinarios, es decir
Minimo de

2
i
e
Mnimo de
2
1
) (

n
i
y
y
Luego la recta
x
y
1 0


+
recibe el nombre de recta estimada, donde x es
la variable independiente ( variable explicativa ), e y la variable dependiente ( variable
explicada por x ).
Al Minimizar
La expresin anterior se obtiene los valores estimados para los betas y vienen dado
por:

2
) (
2
1
x x
y x x y

y
x y
1 0



,
Una manera de cuantificar, en que grado la recta ajustada explica el comportamiento
de los datos, es calcular el coeficiente de determinacin y mide la proporcin de
variabilidad explicada por el modelo, con respecto a la variabilidad total.
Y Sean:
Prof: Natalia Henrquez 146
Prof: Natalia Henrquez



xy y y SSE
1 0
2


n
y
y SST
2
2
) (



Luego
SST
SSE
R 1
2
.
Ejemplos:
1. El grabado con plasma es esencial para la transferencia de figuras de lneas
finas en los actuales procesos de fabricacin de semiconductores.
Los siguientes datos muestran:
X: flujo de cloro , Y: rapidez de grabado.

X 1.5 1.5 2.0 2.5 2.5 3.0 3.5 3.5 4.0
Y 23 24.5 25 30 33.5 40 40.5 47 49
Donde
75 , 11626 , 25 . 902 , 5 . 70 , 5 . 312 , 0 . 24
2 2

i i i i i i
y y x x y x
a) Grficamente dira usted que hay asociacin.
b) Cuantifique la asociacin y concluya.
c) En caso de existir asociacin significativa, determine el modelo ajustado de
regresin lineal.
d) Cuantifique si el modelo es bueno o no.
e) Para una rapidez de grabado de 31 Cunto se espera de flujo de cloro?.
Solucin:
a)
b) corr(X,Y)=97% asociacin lineal positiva ( visto anteriormente en apuntes de
medidas de asociacin).
Prof: Natalia Henrquez 147
diagrama de dispersin
0
10
20
30
40
50
60
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5
flujodecloro
r
a
p
id
e
z

d
e

g
r
a
b
a
d
o
Prof: Natalia Henrquez
c)
x y x y 6 . 10 455 . 6 6 . 10 455 . 6
1 0 1 0
+ +


d) R
2
=94.12%
e)
x y 6 . 10 455 . 6 +

31=6.455+10.6x 31 . 2 x flujo de cloro.


2. Una investigacin de la relacin entre el flujo de trnsito X(miles de automviles
por 24 hr.), y contenido de plomo Y de la corteza de rboles cerca de la autopista,
produjo los datos de las filas X e Y, siguientes:
X 8,3 8,3 12,1 12,1 17 17 17 24,3 24,3 24,3 33,6
Y 227 312 362 521 640 539 728 945 738 759 1263
Y se obtuvo la siguiente informacin:

4 , 149354 5390382 7034 03 , 4198 3 , 198
2 2
i i i i i i
y x y y x x
a) plantee el modelo de regresin lineal
b) plantee el modelo de regresin lineal ajustado
c) Cules son los supuestos?
d) Determine los coeficientes ajustados y la ecuacin ajustada
e) Determine si el modelo se ajusta bien a los datos
f) Para un flujo de 16,3 automviles, cunto se espera de plomo en la corteza de
los rboles?
Solucin:
a)
e x y + +
1 0

b)
x
y
1 0


+
c) E(e)=0 y 0 ) , cov( , ) (
1
2

+ i i
e e e V
d)
x
y
1838 , 36 84 , 12 1838 , 36
1
84 , 12
0
+


e) 91 . 0 72 , 892458 95 , 76458
2
R SST SSE
EL MODELO SE AJUSTA ADECUADAMENTE A LOS DATOS.
f)
577 ) 3 . 16 (

y
.
3. Sea X la variable independiente que representa la rapidez de depsito de SO2
(mg/m
2
/da) y la variable dependiente Y es la prdida de acero en peso (g/m
2
).
a) Construya una grfica de dispersin. Parece razonable el modelo de
regresin Lineal en esta situacin?.
Prof: Natalia Henrquez
X 14 18 40 43 45 112
Y 280 350 470 500 560 120
0
148
Prof: Natalia Henrquez
b) Calcule la ecuacin de la recta de regresin estimada.
c) Qu porcentaje de variacin observada en prdida de acero en peso se
puede atribuir a la relacin del modelo en combinacin con la variacin de la
rapidez de depsito?.
Solucin:
a)

grfico de dispersin
0
500
1000
1500
0 20 40 60 80 100 120
X
Serie1

Si, aunque hay un valor que se escapa a los dems.
b)
x x y x y 31 , 9 95 , 137 95 , 137 3 , 45 31 , 9 560 , 31 , 9
) 272 ( ) 18538 ( 6
3360 272 210120 6
1 0 1 0
2
1
+ +



c) % 26 , 72 744700 8 , 206570
2
R SST SSE .El modelo se ajusta en un
72,26%, segn nuestro criterio se ajusta en forma adecuada, y explica el porcentaje
encontrado.
Ejercicio
4. Cierto asesor econmico, encontr que la utilidad de una empresa (U: expresada en
millones de pesos), dependa linealmente del nmero de artculo vendidos (N:
expresada en unidades). El asesor, determin que el modelo era:
N U 3 20 +
, con un
95 . 0 r
. A partir de esta informacin:
a) Interprete los parmetros obtenidos del modelo
1 0
B y B
.
b) En qu unidades quedan expresados los parmetros del modelo.
c) Interprete el r obtenido.
Prof: Natalia Henrquez 149
Prof: Natalia Henrquez
Tipos De Muestreos
Esta parte fue diseado con la ayuda de algunos alumnos del curso de Estadstica
Ucinf, alumnos con una alta capacidad de investigacin y muy emprendedores.
MUESTREO POR CONGLOMERADO
Indice

Introduccin
Mtodos de seleccin de muestras:
Mtodos de muestreo probabilsticos
Mtodos de muestreo no probabilsticos
Muestreo por Conglomerados
Caractersticas
Ventajas
Problemas
Elementos a tener en cuenta
Esquema de graficos de una muestras por conglomerado
Ejemplos
Conclusin
Introduccin
En el presente trabajo daremos a conocer los distintos tipos de muestreos. Dentro de
los cuales podemos destacar dos grandes grupos, como son los:
Mtodos de muestreo probabilsticos y
Mtodos de muestreo no probabilisticos
Prof: Natalia Henrquez 150
Prof: Natalia Henrquez
En estos mtodos encontraremos varios tipos de muestreos, donde podemos destacar
uno en particular, El Mtodo por Conglomerado, que pertenece al grupo de los
Mtodos de muestreo probabilsticos. y es en el cual nos enfocaremos en esta etapa.
El muestreo por conglomerado consiste en seleccionar aleatoriamente un cierto
nmero de conglomerados (el necesario para alcanzar el tamao muestral establecido)
y en investigar despus todos los elementos pertenecientes a los conglomerados
elegidos.
De este mtodo destacaremos sus caractersticas, sus ventajas y los problemas que
podra ocasionar. Como tambin en que consiste y cuando es conveniente aplicarlo. Se
citaran algunos ejemplos bsicos para simplificar el estudio de este.
Mtodos de seleccin de muestras
Es la actividad por la cual se toman ciertas muestras de una poblacin de elementos de
los cuales vamos a tomar ciertos criterios de decisin, el muestreo es importante
porque a travs de l podemos hacer anlisis de situaciones de una empresa o de
algn campo de la sociedad.
Una muestra debe ser representativa si va a ser usada para estimar las caractersticas
de la poblacin. Los mtodos para seleccionar una muestra representativa son
numerosos, dependiendo del tiempo, dinero y habilidad disponibles para tomar una
muestra y la naturaleza de los elementos individuales de la poblacin. Por lo tanto,
se requiere un gran volumen para incluir todos los
tipos de mtodos de muestreo.
Dentro de los tipos de muestreo encontramos varios tipos, algunos autores proponen
diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos:
Mtodos de muestreo probabilsticos
Mtodos de muestreo no probabilsticos.
Mtodos de muestreo probabilsticos
Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente,
todas las posibles muestras de tamao n tienen la misma probabilidad de ser elegidas.
Slo estos mtodos de muestreo probabilsticos nos aseguran la representatividad de
la muestra extrada y son, por tanto, los ms recomendables. Dentro de los mtodos de
muestreo probabilsticos encontramos los siguientes tipos:
Muestreos Probabilsticos:
Aleatorio Simple
Aleatorio Sistemtico
Estratificado
por Conglomerados
Polietpico
Prof: Natalia Henrquez 151
Prof: Natalia Henrquez
por Ruta Aleatoria
Mtodos de muestreo no probabilsticos
Los mtodos de muestreo no probabilsticos aun siendo conscientes de que no sirven
para realizar generalizaciones, pues no se tiene certeza de que la muestra extrada sea
representativa, ya que no todos los sujetos de la poblacin tienen la misma
probabilidad de ser elegidos. A veces, para estudios exploratorios, el muestreo
probabilstico resulta excesivamente costoso y se acude a mtodos no probabilsticos,
En general se seleccionan a los sujetos siguiendo determinados criterios procurando
que la muestra sea representativa. Dentro de los mtodos no probabilisticos podemos
encontrar los siguientes tipos:
Muestreos No Probabilsticos:
de Conveniencia
de Juicios
por Cuotas
de Bola de Nieve
Discrecional
Dentro del Muestreo Probabilsticos como podemos darnos cuenta, encontramos varios
tipos, entre ellos el Muestreo por Conglomerados, en este mtodo nos enfocaremos
a continuacin.
Muestreo por Conglomerados
Una muestra por conglomerados es una muestra aleatoria, en la cual cada unidad de
muestreo es una coleccin o conglomerado o rea geogrfica que contiene los
elementos mustrales. Aqu se caracteriza por no existir un marco muestral de los
elementos ni de las unidades mustrales.
Consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el
necesario para alcanzar el tamao muestral establecido) y en investigar despus todos
los elementos pertenecientes a los conglomerados elegidos.
Este mtodo requiere de elegir una muestra aleatoria simple de unidades
heterogneas entre s de la poblacin llamadas conglomerados. Cada elemento de la
poblacin pertenece exactamente a un conglomerado, y los elementos dentro de cada
conglomerado son usualmente heterogneos o dismiles.
Este mtodo se obtiene seleccionando aleatoriamente un conjunto de n coleccin de
elementos mustrales, llamados conglomerados, de la poblacin y posteriormente
llevando a cabo un censo completo en cada uno de los conglomerados.
Por ejemplo en un en muestreo aleatorio estratificado primero se particiona la
poblacin en estratos, y entonces se selecciona una muestra aleatoria de cada estrato.
Mientras que en el muestreo por conglomerados es al revs. Despus de
dividir la poblacin en conglomerados se selecciona al azar algunos de ellos.
Dentro de cada conglomerado escogido, se registran todos los elementos
mustrales. En el muestreo aleatorio estratificado las unidades mustrales son los
elementos individuales de la poblacin, en cambio en el muestreo por
Prof: Natalia Henrquez 152
Prof: Natalia Henrquez
conglomerados las unidades mustrales son conglomerados de los
elementos.
Muestreo por conglomerados. La unidad muestral est formada por un grupo de
unidades elementales. Se habla de muestreo por reas cuando los conglomerados se
corresponden con zonas geogrficas y se define el conglomerado.
Caractersticas
La unidades de muestreo suelen ser un grupo de elementos que comnmente
es llamado conglomerado de elementos. El muestreo de estas unidades es llamado
muestreo de conglomerados.
El marco de muestreo es una lista de conglomerados.
La medicin se realiza a todos los elementos del conglomerado seleccionado.
Se utiliza en las investigaciones por muestreo a gran escala.
Ventajas
Reduce el costo del muestreo:
Al no utilizar una lista de elementos de la poblacin (marco) y solo una lista de
conglomerados que es mas fcil y ms barato de obtener.
Reduce el tiempo:
De la organizacin y ejecucin del trabajo de campo.
Problemas
En los conglomerados compactos se espera que los elementos de un mismo
conglomerado tengan caractersticas similares.
Puede no ser necesario entrevistar a todos los elementos de un mismo
conglomerado compacto .
El exceso de informacin al entrevistar a todos los elementos del conglomerado,
incrementa el costo del muestreo.
Elementos a tener en cuenta
Prof: Natalia Henrquez 153
Prof: Natalia Henrquez
Variable de inters: es lo que se desea conocer de la poblacin
Unidades Primarias: Es la primera etapa de muestreo, por ejemplo para conocer
la edad promedio de una provincia, podra dividirse por departamentos. De igual modo
si se tratara de conocer las preferencias por mtodos de evaluacin en el Instituto
puede dividrselo por cursos.
Unidades Secundarias: Es la segunda etapa de muestreo, podran ser las
manzanas de los departamentos, lo que hara necesario una tercer etapa de muestreo
para llegar al elemento muestral. O bien son los alumnos que representan el elemento
muestral.
MAS: tanto las unidades primarias como las secundarias se seleccionaran con l
MAS

Estos conglomerados o reas debern ser mutuamente excluyentes y colectivamente
exhaustivos. Para el caso tenemos distintas metodologa de trabajo:

Se seleccionara aleatoriamente los conglomerados o reas y utilizamos como
elementos mustrales todos los elementos del conglomerado o rea seleccionados.
Esto resulta adecuado cuando existe homogeneidad en la relacin entre la
poblacin y el conglomerado o rea en cuestin, pero dispersin de la variable es
grande. Debemos aclarar que si el conglomerado no guarda relacin con las
caractersticas en relacin con la variable que se desea medir de la poblacin, el
error ser mayor que en el muestreo aleatorio simple.

Se seleccionara aleatoriamente los conglomerados o reas y luego se selecciona
aleatoriamente los elementos del conglomerado o rea. Esto resulta adecuado
cuando existe homogeneidad en la relacin entre la poblacin y el conglomerado o
rea en cuestin, y la dispersin de la variable es baja.

Bien se toman todos los conglomerados o reas en la primer etapa, para luego
seleccionar aleatoriamente los elementos de la segunda etapa. Esto es adecuado
cuando no hay relacin entre la poblacin y los conglomerados o reas que
resultaran de una seleccin aleatoria, por ello se toman todos.

Es un mtodo menos eficaz estadsticamente, esta sujeto a los errores de las etapas
sucesivas de muestreo, aunque los datos se traten finalmente como si viniesen de un
muestreo con una etapa, esto es subestimar el error muestral.

Para este caso se considera que el error muestral disminuye cuando aumenta la
muestra y la homogeneidad de los elementos. Cuando se trabaja con etapas mltiples,
debe tomarse un nmero grande de muestra de conglomerados y uno pequeo de
elementos dentro del conglomerado.
Prof: Natalia Henrquez 154
Prof: Natalia Henrquez
Para obtener una muestra de conglomerados, primero dividir la poblacin en
grupos que son convenientes para el muestreo. Enseguida, seleccionar una porcin de
los grupos al azar o por un mtodo sistemtico. Finalmente, tomar todos los elementos
o parte de ellos al azar o por un mtodo sistemtico de los grupos seleccionados para
obtener una muestra. Bajo este mtodo, aunque no todos los grupos son muestreados,
cada grupo tiene una igual probabilidad de ser seleccionado.
(Por lo tanto la muestra es aleatoria).
Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo
tanto, da menor precisin de las estimaciones acerca de la poblacin) que una muestra
aleatoria simple del mismo tamao. Los elementos individuales dentro de cada
"conglomerado" tienden usualmente a ser iguales.
Por ejemplo la gente rica puede vivir en el mismo barrio, mientras que la gente pobre
puede vivir en otra rea. No todas las reas son muestreadas en un muestreo de reas.
La variacin entre los elementos obtenidos de las reas seleccionadas es, por lo tanto,
frecuentemente mayor que la obtenida si la poblacin entera es muestreada mediante
muestreo aleatorio simple. Esta debilidad puede ser reducida cuando se incrementa el
tamao de la muestra de rea.
El muestreo por conglomerados como ya sabemos requiere de elegir una muestra
aleatoria simple de unidades heterogneas entre s de la poblacin llamadas
conglomerados. Cada elemento de la poblacin pertenece exactamente a un
conglomerado, y los elementos dentro de cada conglomerado son usualmente
heterogneos o dismiles.
Prof: Natalia Henrquez 155
Prof: Natalia Henrquez
Homogeneidad: (Entre) Elementos de diferentes conglomerados.
Heterogeneidad: (Dentro) Entre elementos del mismo conglomerado.
El incremento del tamao de la muestra puede fcilmente ser hecho en muestra de
rea. Los entrevistadores no tienen que caminar demasiado lejos en una pequea rea
para entrevistar ms familias. Por lo tanto, una muestra grande de rea puede ser
obtenida dentro de un corto perodo de tiempo y a bajo costo.
Por otra parte, una muestra de conglomerados puede producir la misma precisin en la
estimacin que una muestra aleatoria simple, si la variacin de los elementos
individuales dentro de cada conglomerado es tan grande como la de la poblacin.
Ejemplo
Suponga que una compaa de servicio de televisin por cable est pensando en abrir
una sucursal en una ciudad grande; la compaa planea realizar un estudio para
determinar el porcentaje de familias que utilizaran sus servicios, como no es prctico
preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al azar,
la cual forma un conglomerado.
En el muestreo por conglomerados, stos se forman para representar, tan fielmente
como sea posible, a toda la poblacin; entonces se usa una muestra aleatoria simple
de conglomerados para estudiarla. Los estudios de instituciones sociales como iglesias,
hospitales, escuelas y prisiones se realizan, generalmente, con base en el muestreo por
conglomerados
Ejemplo Conteo Rpido
Seleccin de una muestra sistemtica de mesas de sufragio, inmediatamente despus
del proceso de elecciones.
Poblacin: Los electores que participaron en la votacin
Conglomerado: Mesa de sufragio
Elemento: Elector
Unidad reportante: Acta electoral
Marco de muestreo: Listado de mesas de sufragio ordenados por ubicacin
geogrfica.
En el muestreo aleatorio estratificado las unidades mustrales con la que nos
enfrentemos es muy comn emplear lo que se denomina muestreo polietpico. Este
tipo de muestreo se caracteriza por operar en sucesivas etapas, empleando en cada
una de ellas el mtodo de muestreo probabilstico ms adecuado.
Este mtodo polietapico por conglomerado se obtiene cuando a partir de una muestra
de conglomerados se extrae una nueva muestra dentro de cada conglomerado.
CONCLUSION
Podemos concluir que este mtodo de seleccin de muestras es l ms
recomendable ya que reduce el costo del muestreo, por que al no utilizar una lista de
Prof: Natalia Henrquez 156
Prof: Natalia Henrquez
elementos de la poblacin y solo una lista de conglomerados es ms fcil y ms
accesible, puesto que es mas barato de obtener reduce el tiempo de ejecucin de este,
siendo mas eficaz y eficiente.
Ahora para finalizar con el mtodo de muestreo por Conglomerados es necesario que
comentemos, que ante lo compleja que puede llegar a ser la situacin real de muestreo
por conglomerado, ya sea por que al dividir la poblacin en conglomerados y
seleccionar al azar algunos de ellos no podemos llegar a algo realmente verdico, aun
as es uno de los mtodos ms recomendables a usar por todas las caractersticas ya
antes mencionadas.
Teora de Muestreo
Muestreo Estratificado
INDICE
Tema.
Introduccin..................................................................................................................
Teora Elemental de Muestreo.........................................................................................
Definicin de Muestreo Estratificado................................................................................
Razones para utilizar estos tipos de muestreo.
Estadsticas..........................................................................................................
Marcos.................................................................................................................
Costos..................................................................................................................
Formas de muestreo en los diferentes estratos.
Valores Poblacionales............................................................................................
Valores Mustrales................................................................................................
Prof: Natalia Henrquez 157
Prof: Natalia Henrquez
Proporciones.........................................................................................................
Conclusin......................................................................................................................

INTRODUCCIN
Este informe fue confeccionado con el fin de investigar sobre la Teora de Muestreo,
enfocndose principalmente en una de sus clasificaciones como es el Muestreo
Estratificado, el cual se aplica cuando sabemos que hay ciertos factores (variables,
subpoblaciones o estratos) que pueden influir en el estudio directamente.
Cabe mencionar que este tipo de muestreo nos presenta ventajas y desventajas en su
uso, considerando as las razones ms importantes, las cuales se vern en el desarrollo
de la investigacin.
TEORA ELEMENTAL DE MUESTREO.
La teora del muestreo es el estudio de las relaciones existentes entre una
poblacin y muestras de la misma. Tiene gran inters en muchos aspectos de la
estadstica. Por ejemplo permite estimar cantidades desconocidas de la poblacin
(tales como la media poblacional, la varianza, etc.), frecuentemente llamada
parmetros poblacionales o brevemente parmetros, a partir del conocimiento, de las
correspondientes cantidades maestrales (tales como la media, la varianza, etc.), a,
menudo llamadas estadsticos maestrales o brevemente estadsticos.
La teora de muestreo es tambin til para determinar si la diferencia que se puedan
observar entre dos o ms muestras son debidas a la aleatoriedad de las mismas o si
por el contrario son solamente significativas. Tales preguntas surgen por ejemplo, al
ensayar un nuevo suero para el tratamiento de una enfermedad, o al decir si un
proceso de produccin es menor que otro. Estas decisiones envuelven a los llamados
ensayos e hiptesis de significacin, que son de gran importancia en la teora de la
decisin.
A continuacin se investigar una de sus clasificaciones como es el Muestreo
Estratificado.
MUESTREO ESTRATIFICADO
El muestreo estratificado consiste en dividir la poblacin en L subconjuntos o
estratos, y de cada uno de ellos seleccionar una muestra probabilstica; de manera
independiente de un estrato a otro.
Prof: Natalia Henrquez 158
Prof: Natalia Henrquez
Existen tres razones importantes para utilizar este tipo de muestreo:
i. estadsticas,
ii. marcos; y de
iii. costos.
i. La razn estadstica ocurre cuando la poblacin est constituida por unidades
heterogneas y podemos tener una idea previa de los grupos de unidades ms
homogneas entre s, entonces es conveniente formar estratos.
Los estratos son subconjuntos de la poblacin que agrupan unidades
homogneas, aunque sean heterogneas entre estratos.
Cada estrato se muestrea por separado y se obtienen los estimadores de
parmetros (totales, medias, proporciones) para cada estrato.

Se supone que se conoce el nmero de unidades en cada estrato (Nh).
Es importante sealar que si se usan estimadores de razn o de regresin o si el
muestreo se hace con probabilidad proporcional al tamao, los estratos se forman con
subconjuntos de unidades donde sea constante la proporcionalidad de Y a X, aunque
esa proporcionalidad cambie de estrato a estrato.
Como ejemplos de la razn estadstica para usar estratos, considrense:
(a) En un muestreo donde interesa conocer alguna caracterstica de los hogares
en la Regin Metropolitana (por ejemplo: gastos en alimentos, ropa, ingresos, tipo de
casa habitacin, aos de escolaridad del padre, nmero de hijos, etctera). Se sabe
que esas caractersticas dependen fuertemente del nivel socioeconmico de las
familias, por lo tanto conviene hacer estratos considerando reas de la ciudad con
niveles socioeconmicos semejantes.
As, las colonias se pueden clasificar a priori con relacin al nivel
socioeconmico como: muy alto, alto, medio, medio bajo y bajo, formando de esta
manera cinco estratos.
La encuesta se planea para cada estrato por separado. El efecto de formacin
de estratos es reducir la variabilidad de los estimadores. La variabilidad de se
Prof: Natalia Henrquez 159
Prof: Natalia Henrquez
puede reducir mucho si los estratos son muy homogneos dentro de cada uno de ellos
y heterogneos entre los mismos.
(b) En un muestreo para estimar la cosecha total de VII Regin, se conoca que
el estado fisiolgico, edad y estado de sanidad de los rboles influye mucho en su
produccin. Entonces, se tomaron como estratos, categoras de rboles bien definidas
y homogneas en lo que respecta a edad, estados fisiolgicos y de sanidad. Adems,
los predios se agruparon en estratos de acuerdo a la regin ecolgica donde estaban
ubicados. Esto es porque la productividad del caf vara segn las condiciones
ecolgicas como altura sobre el nivel del mar, vientos, temperaturas extremas,
etctera.
(c) En una encuesta para estimar el consumo de energa elctrica es
conveniente agrupar las fbricas en estratos, as quedaran agrupadas en: fbricas
grandes, fbricas pequeas, empresas de produccin familiar y un estrato final
constituido por casa-habitacin. Esto, porque sabemos que el consumo de electricidad
va a ser muy variable entre estratos, y esperamos que sea menor dentro de estos.
ii. Otra razn poderosa para formar estratos es la disponibilidad de marcos.
Si para una parte de la poblacin se tiene un buen marco, ste se usa para el
muestreo de esa parte y la o las otras partes de la poblacin se muestrean usando
otros marcos ms imprecisos y, posiblemente distintos esquemas (diseos) de
muestra.
Por ejemplo, en encuesta de hogares se cuenta con un buen marco para la zona
urbana de construccin antigua; pero las zonas rurales y las urbanas de construccin
reciente no tienen un marco adecuado.
Entonces se utilizan planos catastrales para las zonas urbanas antiguas (un
estrato), se usan fotografas areas para zonas rurales (otro estrato) y las reas de
posible nueva urbanizacin (otro estrato) se delimitan como otro marco; se muestrean
reas y se investigan las nuevas urbanizaciones (muestreo en etapas o
conglomerados).
iii. Otra razn ms para construir estratos puede ser el costo de localizar y
levantar la informacin de las unidades, por ejemplo: si en una encuesta de
Prof: Natalia Henrquez 160
Prof: Natalia Henrquez
predios agrcolas hay una regin cuyo acceso es difcil (por avin o a caballo
nicamente), esa regin puede constituir un estrato, que ser muestreado con
un tamao de muestra pequeo.
Lo ms frecuente es que los tres criterios para formacin de estratos coincidan,
de modo que los estratos formen unidades homogneas con un mismo tipo de marco y
con costos de localizacin y captacin de informacin semejantes.
Se pueden utilizar diferentes formas de muestreo en los diferentes estratos, sin
embargo, se considerar en este escrito como una introduccin al tema, aquel en el
cual cada estrato se muestrea usando mas.
Ms adelante se consideran las muestras complejas, donde se amplia el uso de
estratos.
Considrese la siguiente notacin:
Nh= nmero de unidades en estrato h-simo;
h=1,2,...,L;
L= nmero de estratos.
Valores Poblacionales.
Valor de la medicin en el elemento i-simo del estrato h-simo.
Total de unidades en la poblacin.
Media poblacional del estrato h-simo.
Total poblacional del estrato h-simo.

Varianzas poblacionales del estrato h-simo.
Total poblacional del estrato h-simo.
Prof: Natalia Henrquez 161
hi
Y
1
L
h
h
N N

1
h
N
hi
i
h
h
Y
Y
N

1
h
N
h h h hi
i
Y N Y Y

( )
2
2 1
1
h
N
hi h
i
h
h
Y Y
S
N

1
h
N
h h h hi
i
Y N Y Y

( )
2
2 1
1
h
N
hi h
i
h
h
Y Y
S
N

Prof: Natalia Henrquez


Varianzas poblacionales del estrato h-simo.
Total de toda la poblacin.
Media de los valores Yhi en toda la poblacin.
Proporcin del tamao del estrato h-simo.
Valores muestrales
En esta parte se considera cualquier estrategia de muestreo
probabilstico en cada estrado, incluso pueden ser diferentes de un estrato a otro.
Supngase que de manera independiente se toman muestras de cada estrato.
Sea nh el tamao de muestra en el estrato h-simo.
La muestra total es
Supngase que se quiere estimar el total de la poblacin, esto es:
Para esto con la muestra de cada estrato se estima el total, sea el estimador
insesgado o con sesgo despreciable para el caso de estimadores de razn o de
regresin, su varianza, adems, sea un estimador de esa varianza.
El estimador del total es la suma de los estimadores de los totales
de los estratos (es un estimador insesgado).
Prof: Natalia Henrquez 162
1 1 1
h
N
L L
h h i
h h i
Y Y Y



1

L
h
h
h
Y N Y

h
Y
Y
N

h
h
N
W
N

1
1
L
h
h
W

1
L
h
h
n n

1 1 1
h
N L L
h hi
h h i
Y Y Y



1

L
h
h
Y Y

Prof: Natalia Henrquez


Esto es vlido con cualquier diseo de muestra y estimadores por estrato, los
que pueden ser distintos en los diferentes estratos.
La varianza del estimador del total es, que es la suma de las
varianzas de los estimadores de los totales de estratos.
Esto es por tener muestras independientes en los estratos.
Adems el estimador de la varianza del estimador del total es:
Suponiendo distribucin normal de que se tiene:
Si no se puede suponer normalidad sese el valor 4.4 en lugar de 1.96
(T.Tchebycheff).
Estas expresiones para son vlidas para cualquier forma de muestrear
estratos.
La primera aproximacin al uso de estratos es considerar que se usa ms
en cada estrato entonces:
1

h
n
hi
i
h hh h hh
h
y
Y Ny N NY
n

donde yhi son los valores observados en la unidad i-sima de la muestra (tamao nh)
del estrato h-simo.
El estimador del total poblacional es:
Prof: Natalia Henrquez 163
1

( ) ( )
L
h
h
V Y V Y

1

( ) ( )
L
h
h
V Y V Y


1.96 ( ) .95

1.96 ( ) 1.96 ( ) .95
P Y Y V Y
P Y V Y Y Y V Y
1
<
1
]
1
+
1
]
&

Y
Prof: Natalia Henrquez
1 1
1 1


h
h
n
L
hi
h
h i
h
n
L
h
hi
h i
h
y
Y N
n
N
y
n


(6.1)
Donde corresponde al factor de expansin, de las unidades obtenidas en cada
estrato
Su varianza terica es:
2 2
1 1
2
2
1

() () ( )
1
L L
h h h
h h
L
h h
h
h h h
VY VY NVy
nS
N
Nn

(6.2)
Esta varianza se estima al sustituir Sh por su estimador en cada estrato.
El estimador insesgado de Sh es
.
Ntese que es la misma expresin que Sh, pero la primera es con valores
de la muestra y la segunda con los valores de todo el estrato h-simo.
Recurriendo al Teorema central del lmite, para cada estrato, se tendr que
.
Esto es mucho ms factible aunque cada
h
y
no tenga distribucin normal, si
se tienen muchos estratos. Se puede decir que los errores de estimacin tienden a
cancelarse de un estrato a otro.
Prof: Natalia Henrquez 164
h
h
N
n
( )
2
2
1
1
h
n
hi h
h
i
h
y y
n
S


~N [ , ( )] Y Y V Y
2

h
S
Prof: Natalia Henrquez
Si se estima , se puede construir un intervalo de confianza aproximado para el
total de la poblacin:
(6.3)
Al dividir cada trmino de (6.3) entre
Y
, tenemos el intervalo de confianza
para , la media de la poblacin.
Si se considera que la muestra es grande en cada estrato, la muestra total ser
mayor an. Esto justifica el uso del valor 1.96 en lugar del valor de las tablas de t.
Ntese que:
2
2
1


( ) 1
L
h h
h
h
h h
n S
V Y N
N n

_


,

(6.4)
Si lo que se quiere estimar es , se tendr que,
1
1 1

L
h h L L
h h
h h h
h h
Ny
N Y
Y y Wy
N N N

(6.5)
Donde proporcin del tamao de estrato h-simo.
Ntese que (6.5) es un promedio ponderado de los promedios mustrales y su
varianza es:
(6.6)
La que se estima con:
2
2
1

( ) 1
L
h h
h
h
h h
n S
V Y W
N n

_


,

(6.6a)
De manera semejante, el intervalo de confianza aproximado para
Y
es el
siguiente:
Prof: Natalia Henrquez 165

( ) V Y
h
N N

Y
h
h
N
W
N

( )
2
2
1

1
L
h h
h
h
h h
n S
V Y W
N n

_


,


1.96 ( ) 1.96 ( ) 0.95 [ ] P Y V Y Y Y V Y < < + &
Prof: Natalia Henrquez
An con muestras chicas en cada estrato (nh = 2,3,4) si se tienen mas de 10 estratos
se puede tener normalidad para
Y
, esto en virtud de la compensacin de errores.
Proporciones
Si lo que se requiere estimar es P, la proporcin de elementos de la poblacin
que tienen una caracterstica determinada, se usan las equivalencias dadas por
Estas equivalencias surgen al considerar que

1 Si la unidad i-sima del estrato h
Yhi= tiene la caracterstica
0 De otro modo
Slo si las Ph son muy diferentes de estrato a estrato, vale la
pena estratificar.
Si , no conviene usar los estratos.
CONCLUSIN.
Al finalizar esta investigacin relacionada con la Teora de Muestreo, en la cual se di a
conocer una de sus clasificaciones como es el Muestreo Estratificado, diremos que con
los conceptos ya tratados vimos claramente una desventaja de este, la cual es que s
conoce la distribucin en la poblacin de las variables utilizadas para la estratificacin.
Sin embargo este muestreo estratificado tambin cuenta con ventajas y una de ellas es
que tiende a asegurar que la muestra represente adecuadamente a la poblacin en
Prof: Natalia Henrquez
,
h h
Y P ,
h h
y p
( )
2
1
1


( ) ( ) 1
L
h h
h
h
h
h h
p p n
VY VP W
N n

_


,

166


1.96 ( ) 1.96 ( ) 0.95 P Y V Y Y Y V Y
1
+
1
]
&
.2 .8
h
P h
Prof: Natalia Henrquez
funcin de los criterios de estratificacin y adems se obtienen estimaciones ms
precisas que con el ms.
MUESTREO SISTEMATICO
NDICE
Introduccin............................................................................................
Concepto de Muestreo............................................................................
Terminologa...........................................................................................
Ventajas y desventajas de los distintos tipos de muestreo...............
Generalidades del Muestreo Sistemtico.............................................
Muestreo Sistemtico.............................................................................
Ejemplos................................................................................................
Conclusin...........................................................................................
Introduccin
La estadstica trabaja sobre poblaciones, extrae conclusiones sobre la base
de un anlisis de un muestrario de datos de una poblacin. Hay muchas maneras
de tomar una muestra de una poblacin. Adems las conclusiones que se extraen
acerca de la poblacin dependen de como se selecciona la muestra, deseamos
que la muestra sea representativa de la poblacin. Supongamos que una nave
espacial del planeta Marte llega por primera vez a la Tierra, y aterriza por
casualidad en el centro de frica. Despus de haber aterrizado en un claro de la
selva, los marcianos recogen muestras de la vegetacin que los rodea, toman nota
de la constitucin, temperatura, presin y humedad del ambiente y capturan como
muestra a tres nios pigmeos. Vuelven a Marte y pasan varias semanas
analizando los datos recogidos, haciendo, mas tarde, el informe para sus
superiores. ste da a entender que la Tierra est cubierta de selva, envuelta en un
ambiente de aire caliente y hmedo y poblada de gente de piel negra, casi sin
ropa cuya estatura media no es superior a un metro.
Prof: Natalia Henrquez 167
Prof: Natalia Henrquez
Del ejemplo observamos que hay varias cosas a tener en cuenta cuando se
procede a tomar una muestra. Hay que elegir el tamao de la muestra y esto
depender no solamente de la cantidad de informacin que se quiere conseguir, y
el grado de certeza deseada, sino tambin del costo del muestreo. Cualquiera sea
el mtodo elegido, el requisito ms importante es que la muestra obtenida
proporcione una imagen tan real como sea posible de aquella poblacin que s ha
sometido al muestreo.
MUESTREO
El muestreo es una herramienta de la investigacin cientfica. Su funcin
bsica es determinar que parte de una realidad en estudio (poblacin o
universo) debe examinarse con la finalidad de hacer inferencias sobre dicha
poblacin. El error que se comete debido a hecho de que se obtienen
conclusiones sobre cierta realidad a partir de la observacin de solo una parte
de ella, se denomina error de muestreo. Obtener una muestra adecuada
significa lograr una versin simplificada de la poblacin, en que se reproduzca
de algn modo sus rasgos bsicos.
Terminologa
Poblacin Objeto: Conjunto de individuos de los que se quiere obtener una
informacin.
Unidades de muestreo: Numero de elementos de la poblacin, no solapados,
que se van a estudiar. Todo miembro de la poblacin pertenecer a una solo una
unidad de muestreo.
Unidad de anlisis: Objeto o individuo del que hay que obtener a informacin.
Marco Muestral: Lista de unidades o elementos de muestreo.
Muestra: Conjunto de unidades o elementos de anlisis sacados del macro.
Entre los mtodos de muestreo probabilsticos ms utilizados en investigacin
encontramos:
Muestreo aleatorio simple
Muestreo estratificado
Prof: Natalia Henrquez 168
Prof: Natalia Henrquez
Muestreo sistemtico
Muestreo polietpico o por conglomerados
Ventajas e inconvenientes de los distintos tipos de muestreo probabilstico

CARACTERSTICAS
VENTAJAS INCONVENIENTES
Aleatorio simple Se selecciona una muestra
de tamao n de una
poblacin de N unidades,
cada elemento tiene una
probabilidad de inclusin
igual y conocida de n/N.
Sencillo y de fcil
comprensin.
Clculo rpido de
medias y
varianzas.
Se basa en la
teora estadstica,
y por tanto existen
paquetes
informticos para
analizar los datos
Requiere que
se posea de
antemano un
listado
completo de
toda la
poblacin.
Cuando se
trabaja con
muestras
pequeas es
posible que no
represente a la
poblacin
adecuadament
e.
Sistemtico Conseguir un listado
de los N elementos de
la poblacin
Determinar tamao
muestral n.
Definir un intervalo
k=N/n.
Elegir un nmero
aleatorio, r, entre 1 y k
(r=arranque aleatorio).
Seleccionar los
elementos de la lista.
Fcil de aplicar.
No siempre es
necesario tener
un listado de toda
la poblacin.
Cuando la
poblacin est
ordenada
siguiendo una
tendencia
conocida, asegura
una cobertura de
unidades de todos
los tipos.
Si la constante
de muestreo
est asociada
con el
fenmeno de
inters, las
estimaciones
obtenidas a
partir de la
muestra
pueden
contener sesgo
de seleccin
Prof: Natalia Henrquez 169
Prof: Natalia Henrquez
Estratificado En ciertas ocasiones
resultar conveniente
estratificar la muestra segn
ciertas variables de inters.
Para ello debemos conocer
la composicin estratificada
de la poblacin objetivo a
muestrear. Una vez
calculado el tamao
muestral apropiado, este se
reparte de manera
proporcional entre los
distintos estratos definidos
en la poblacin usando una
simple regla de tres.
Tiende a asegurar
que la muestra
represente
adecuadamente a
la poblacin en
funcin de unas
variables
seleccionadas.
Se obtienen
estimaciones ms
precisa
Su objetivo es
conseguir una
muestra lo mas
semejante posible
a la poblacin en
lo que a la o las
variables
estratificadoras se
refiere.
Se ha de
conocer la
distribucin en
la poblacin de
las variables
utilizadas para
la
estratificacin.

Conglomerados Se realizan varias
fases de muestreo
sucesivas
(polietpico)
La necesidad de
listados de las
unidades de una
etapa se limita a
aquellas unidades de
muestreo
seleccionadas en la
etapa anterior.
Es muy eficiente
cuando la
poblacin es muy
grande y
dispersa.
No es preciso
tener un listado de
toda la poblacin,
slo de las
unidades
primarias de
muestreo.
El error
estndar es
mayor que en
el muestreo
aleatorio
simple o
estratificado.
El clculo del
error estndar
es complejo.
Generalidades del Muestreo Sistemtico
En algunos casos la manera ms prctica de realizar un muestreo consiste
en seleccionar, un primer elemento al azar y luego ir escogiendo cada x-trmino
de una lista, o dejar pasar a x- individuos y preguntar al que sigue y as
sucesivamente. Aunque un muestreo sistemtico puede no ser aleatorio de
acuerdo con la definicin, a menudo es razonable tratar las muestras sistemticas
como si fueran aleatorias.
Prof: Natalia Henrquez 170
Prof: Natalia Henrquez
El riesgo de los muestreos sistemticos es el de las periodicidades ocultas.
Supongamos que queremos testear el funcionamiento de una mquina, para lo
cul vamos a seleccionar una de cada 15 piezas producidas. Si ocurriera la
desgracia de que justamente 1 de cada 15 piezas fuese defectuosa y el error de la
mquina fuera defectuoso peridicamente, tendramos dos posibles resultados
muestrales:
- Que falla siempre
- Que no falla nunca.
Este procedimiento exige, numerar todos los elementos de la poblacin,
pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese
nmero aleatorio i, que es un nmero elegido al azar, y los elementos que integran
la muestra son los que ocupa los lugares i, i k, i 2k, i 3k,...,i (n-1)k, es decir se
toman los individuos de k en k, siendo k el resultado de dividir el tamao de la
poblacin entre el tamao de la muestra: k= N/n. El nmero i que empleamos
como punto de partida ser un nmero al azar entre 1 y k.
El riesgo este tipo de muestreo est en los casos en que se dan
periodicidades en la poblacin ya que al elegir a los miembros de la muestra con
una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacin. Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 ltimos
mujeres, si empleamos un muestreo aleatorio sistemtico con k=10 siempre
seleccionaramos o slo hombres o slo mujeres, no podra haber una
representacin de los dos sexos.
Observacin
El mtodo tal como se ha definido anteriormente es sesgado si no es entero, ya
que los ltimos elementos de la lista nunca pueden ser escogidos. Un modo de
evitar este problema consiste en considerar la lista como si fuese circular (el
elemento N+1 coincide con el primero) y:
Sea k el entero ms cercano a ;
Se selecciona un nmero al azar m, entre 1 y N;
Se toma como muestra los elementos de la lista que consisten en ir
saltando de k elementos en k, a partir de m, teniendo en cuenta que la lista
es circular.
Se puede comprobar que con este mtodo todos los elementos de la lista tienen la
misma probabilidad de seleccin
Prof: Natalia Henrquez 171
Prof: Natalia Henrquez

Como se menciono anteriormente el muestreo sistemtico consiste en dividir la
poblacin de N unidades en k subgrupos de n elementos, y tomar de esos
subgrupos al azar uno de ellos, como la muestra.
Se obtiene k como el cociente
K= N/n kn = N
Se obtiene un numero aleatorio entre 1 y k. Se seleccionan en la muestra los
elementos i, i+k, i=2k, i+3k,....i+(n-1)k.
Esto equivale a partir la poblacin en k conjuntos de n
elementos; y seleccionar uno de ellos.
i 1 2 ... i ... k
1 1 2 ... i ... k
2 1+k 2+k ... i+k ... 2k
3 1+2k 2+2k I i+2k ... 3k
. . . . .
. . . . .
. . . . .
j 1+(j-1)k 2+(j-1)k ... j+(j-1)k ... jk
. . . .
. . . .
. . . .
n 1+(n-1)k 2+( n-1) k ... i+(n-1) k ... nk
El muestreo sistemtico procede al tomar al azar un nmero entre 1 y k, sea i
entonces los elementos de la muestra son:
u
i
, u
i+k
, u
i+2k
,..., u
i+(n-1)k
Para fines de estimacin se tiene que la probabilidad de seleccionar en la
muestra cualquier elemento o unidad es :
i = P( Ui ) = 1 = n
Prof: Natalia Henrquez 172
Prof: Natalia Henrquez
K N
El arranque es aleatorio ya que se toma un nmero entre 1 y k con probabilidad:
P ( Ui ) = 1 i = 1 ... N
K
En caso de que N no sea divisible exactamente entre n, se procede igual; y
entonces habr muestras de tamao n y otras de tamao n+1.
Ejemplo
N=14, se quiere n=3. Entonces N=nk+resto. N=3k+2, con k=4.
Es decir al dividir N entre n , no se tiene un entero, se toma el entero inmediato
inferior.
14 entre 3 da a 4 y sobra algo, tomamos como k a 4.
Si i=1, la muestra es U
1
, U
5
, U
9
y U
13
Si i=2, la muestra es U
2
, U
6
, U
10
y U
114
Si i=3, la muestra es U
3
, U
7
, y U
11

Si i=4, la muestra es U
4
, U
8
, y U
12
Hay dos muestras de tamao 4 y dos de tamao 3. Se intent
n=3.
En general se intenta n y se tienen algunas muestras de n y otras de n+1.
Un ejemplo de muestreo sistemtico:
Se va a investigar el ingreso en las familias de los estudiantes de una
facultad. Se tiene la lista en orden alfabtico por apellido. Si se considera que el
nombre no tiene ninguna relacin con el ingreso en pesos de la familia, se puede
usar el muestreo sistemtico y se considerar como una muestra aleatoria simple
(mas) .
Cuando la poblacin est en un orden aleatorio en lo que respecta a los valores
Y
i
, se usa el muestreo sistemtico para facilitar la extraccin de la muestra. El
muestreo, en este caso, es equivalente al muestreo aleatorio irrestricto y se
Prof: Natalia Henrquez 173
Prof: Natalia Henrquez
usarn por lo tanto las mismas expresiones para estimar Y o el total de la
poblacin Y como se hizo con mas:

Cuando la poblacin est ordenada con relacin a los valores de Y
i
, con tendencia
a cambiar paulatinamente dichos valores, el muestreo sistemtico produce
varianzas de los estimadores menores que con el mtodo mas ver grfica. Esto
se debe a que la muestra queda ms dispersa sobre la poblacin. Se asegura que
la muestra sea ms representativa.
Un ejemplo de esta situacin es el que ocurre cuando se va a muestrear ramas de un
rbol para evaluar su produccin de frutos (caso del caf). Si existe una tendencia de la
produccin a tener valores mayores en las ramas ms bajas, el muestreo sistemtico
asegura que en la muestra aparezcan ramas de todas las alturas del rbol.
Prof: Natalia Henrquez 174
Prof: Natalia Henrquez
Otro ejemplo donde sucede esto es en algunos muestreos de viviendas, donde es
posible numerar las manzanas o cuadras iniciando en colonias (urbanizaciones)
de bajo nivel econmico, pasando gradualmente a niveles econmicos altos. Las
flechas indican el orden de numeracin.
Si la caracterstica medida produce valores Y
i
, que dependen del nivel
econmico, se tiene una poblacin ordenada y el muestreo sistemtico produce
varianzas menores que mas.
No hay expresiones vlidas para estimadores y varianzas de estimadores cuando
se usa el muestreo sistemtico en poblaciones que no tienen orden aleatorio. Al
usar el muestreo sistemtico en poblaciones ordenadas, se pueden utilizar las
expresiones para el mas como una aproximacin, y se sabe que en realidad las
varianzas sern menores (resulta un mtodo conservador).
Se usa frecuentemente el muestreo sistemtico para seleccionar unidades
secundarias o terciarias, y la varianza de estimadores a ese nivel no se va
Prof: Natalia Henrquez 175
Prof: Natalia Henrquez
requerir. Pero la muestra es mas representativa.
Si la poblacin tiene un orden que se refleja en cambios peridicos de los valores
de Y
i
, el muestreo sistemtico puede producir varianzas mayores. En este caso el
problema es que la muestra puede coincidir con valores todos bajos (altos) de Y
i
,
siendo de esta manera poco representativa y con fluctuaciones fuertes de muestra
a muestra.
Esto puede suceder cuando la poblacin consiste en los volmenes de ventas
de una tienda en un periodo de tiempo. Otro ejemplo es en el muestreo de
plantas cultivadas (maz, trigo, etctera) en donde ciertas reas del terreno se
riegan en un da determinado y otras reas otro da.
En resumen el muestreo sistemtico es una herramienta delicada que
puede ser mejor, igual o peor que mas.
Ejemplos
1-Se dispone de una lista de las 100 empresas multinacionales ms grandes de
los Estados Unidos en el ao 2000, que tuvieron los ingresos ms altos en el
extranjero. Los nombres de estas empresas has sido codificados con nmeros de
dos dgitos, como:
Cdigo Empresas
multinacionales
Prof: Natalia Henrquez 176
Prof: Natalia Henrquez
(Datos ficticios)
00 Allied Corporation
01 Avon Products
02 Bank America
03 Chrysler
04 Coca-Cola
. .
99 Xerox
Seleccionar una muestra aleatoria sistemtica de cinco compaas.
Solucin:
Paso 1) Para seleccionar una muestra aleatoria sistemtica de n = 5 compaas,
se determina k al dividir el tamao de la poblacin, N = 100, entre el tamao
deseado de muestra.
k = N/n = 100/5 = 20
Significa que, se desea incluir a cada vigsima empresa de la lista, de las 100
empresas multinacionales.
Paso 2) El procedimiento requiere que el punto de inicio, la primer compaa, se
escoja al azar. Al sacar un nmero entre 00 y 19 de un recipiente, o al usar una
tabla de nmeros aleatorios, podra resultar que la compaa nmero 09 deba
seleccionarse como el punto de partida. Entonces toda nuestra muestra estara
formada de las compaas codificadas como 09, 29, 49 y 89. En caso de que
nuestra seleccin inicial hubiera sido 01 o 17, la muestra desde luego habra sido
diferente, es decir, 01, 21, 41, 61, y 81 o 17, 37, 57, 77 y 97, respectivamente.
2-Utilizando la tabla de nmeros aleatorios y tomando en consideracin que se
est trabajando con un marco de muestreo de 1,000,000 elementos, obtener :
a) Una muestra aleatoria representativa de 40 elementos.
b) Una muestra sistemtica de 50 elementos.
Solucin:
Prof: Natalia Henrquez 177
Prof: Natalia Henrquez
a) una muestra aleatoria representativa de 40 elementos.
Muestreo Aleatorio
No. Muestra No. Muestra
1 1,000,000 21 175,875
2 842,268 22 39,758
3 989,320 23 130,477
4 449,352 24 306,118
5 54,997 25 795,419
6 937,670 26 695,892
7 205,165 27 750,037
8 532,964 28 556,707
9 352,964 29 533,512
10 628,898 30 229,536
11 139,092 31 422,086
12 82,291 32 68,227
13 443,627 33 568,673
14 720,731 34 512,809
15 552,282 35 747,744
16 918,820 36 428,501
17 835,869 37 775,951
18 763,877 38 154,035
19 94,564 39 545,561
20 691,345 40 997,333
b) una muestra sistemtica 50 elementos.
P1) Para seleccionar una muestra aleatoria sistemtica de n = 50 elementos, se
determina k al dividir el tamao de la poblacin, N = 1,000,000, entre el tamao
deseado de muestra.
k = N/n = 1,000,000 /50 = 20,000
Significa que, se desea incluir a cada 20,000 elemento de la lista, de los
1,000,000, elementos.
P2) El procedimiento requiere que el punto de inicio, el primer elemento, se escoja
al azar. Al sacar un nmero entre 00,001 y 20,000 de un recipiente, o al usar una
tabla de nmeros aleatorios, resulta que el nmero 20,000 es seleccionado como
Prof: Natalia Henrquez 178
Prof: Natalia Henrquez
el punto de partida. Entonces toda la muestra estara formada de los elementos
siguientes:
Muestreo Sistemtico
No. Muestra No. Muestra
1 20,000 26 520,000
2 40,000 27 540,000
3 60,000 28 560,000
4 80,000 29 580,000
5 100,000 30 600,000
6 120,000 31 620,000
7 140,000 32 640,000
8 160,000 33 660,000
9 180,000 34 680,000
10 200,000 35 700,000
11 220,000 36 720,000
12 240,000 37 740,000
13 260,000 38 760,000
14 280,000 39 780,000
15 300,000 40 800,000
16 320,000 41 820,000
17 340,000 42 840,000
18 360,000 43 860,000
19 380,000 44 880,000
20 400,000 45 900,000
21 420,000 46 920,000
22 440,000 47 940,000
23 460,000 48 960,000
24 480,000 49 980,000
25 500,000 50 1,000,000

Conclusin
Podemos concluir que el Muestreo sistemtico como una herramienta de
la investigacin cientfica la cual determina una parte de la realidad en estudio
ya sea de la poblacin o universo, que es fcil de aplicar y no necesariamente
se requiere un listado de toda la poblacin, esta ultima es la desventaja, ya
Prof: Natalia Henrquez 179
Prof: Natalia Henrquez
que no se puede realizar con exactitud un estudio completo y detallado, pero
se puede deducir y concluir resultados con respecto a una muestra elegida
segn los puntos analizados anteriormente.
Prof: Natalia Henrquez 180

You might also like