Professional Documents
Culture Documents
Estadstica Descriptiva
Estadstica Inferencial
ESTADSTICA DESCRIPTIVA: se encarga de la presentacin adecuada de la informacin (tablas,
grficas, histogramas, etc.)
ESTADSTICA INFERENCIAL: se especializa en la estimacin e inferencia de parmetros (promedio,
desviacin estndar, etc.).
APUNTES DE ESTADISTICA
ORGANIZACIN DE DATOS
Una vez que se ha realizado un experimento el resultado generalmente es un conjunto de datos u
observaciones, sin embargo, tal como aparecen pueden no resultar adecuados para obtener informacin
de ellos, por lo que es necesario realizar en la mayora de los caso un trabajo mnimo que consiste en la
organizacin y presentacin de los datos de manera adecuada. Esto es precisamente el objetivo de la
estadstica descriptiva.
Como primer paso los datos pueden ser acomodados en un ARREGLO, el cual tiene el objetivo de
presentar los datos con un mnimo de orden. Es deseable que este orden sea descendente o
ascendente, como se muestra a continuacin.
NUMERO DE PERSONAS VIVIENDO EN UN GRANJAS
2
2
3
3
4
4
4
4
5
5
5
5
5
5
6
6
6
6
6
6
6
7
7
7
7
7
7
7
7
8
8
8
8
8
8
8 9 10
9 9 11
9 10 11
9 10 12
9 10 12
y mnimo
R = Xmax - Xmin
b) Ahora proceda a dividir el rango en INTERVALOS DE CLASE, se sugiere que el nmero de intervalos
de clase no sea menor a 6 ni mayor a 20.
c) La LONGITUD DE EL INTERVALO de cada clase debe ser la misma en todas las clases y deber ser
de tal que el punto medio de cada intervalo tenga en mismo nmero de dgitos y precisin que los datos
originales.
d) Una vez definidos adecuadamente los intervalos proceda a contar los datos que se encuentren dentro
de su lmite inferior y su lmite superior, el nmero de datos que caen dentro de dicho intervalo,
constituye la FRECUENCIA DE CLASE.
e) Tome en cuenta que cada dato solo pertenece solamente a una clase, por lo que no debe haber
ambigedad en su pertenencia a alguna clase.
f) El punto medio de cada intervalo es llamado LA MARCA DE CLASE y representar a todos los puntos
que caigan dentro del intervalo.
g) LA TABLA DE DISTRIBUCIN DE FRECUENCIA se construye colocando en la primera columna (
fila) los intervalos de clase y/o las marcas de clase y en la siguiente columna ( fila) las frecuencias
correspondientes.
APUNTES DE ESTADISTICA
EJEMPLOS
1. Obtenga la tabla de la distribucin de frecuencias para los datos siguientes.
NMERO DE PERSONAS VIVIENDO EN UN GRANJAS
2 4 5 6 6 7 8 8
10
2 4 5 6 7 7 8 9
11
3 4 5 6 7 7 8 9 10 11
3 5 5 6 7 7 8 9 10 12
4 5 6 6 7 8 8 9 10 12
Por la naturaleza de los datos presentados en la tabla se puede optar por que cada uno de los valores: 2,
3, 4, 5, 6, 7, 8, 9, 10 11 y 12 sean los intervalos, entonces
X
FR(X)
2
2
3
2
4
4
5
6
6
7
8
7
9
6
10
4
11
2
12
2
(2) Obtenga la tabla de la distribucin de frecuencias para los datos siguientes. Divida en 7 clases.
2.3
2.3
2.4
2.6
2.8
3.0
3.4
3.5
3.5
3.6
3.7
3.8
3.8
3.9
3.9
4.0
4.0
4.1
4.1
4.3
4.3
4.4
4.4
4.4
4.5
4.5
4.6
4.6
4.6
4.6
4.7
4.8
4.8
4.9
4.9
5.0
5.0
5.1
5.1
5.3
El rango es
R = 7.1-2.3=4.8.
ancho =4.8/7=0.6857
5.4
5.5
5.6
5.7
5.8
5.9
6.0
6.4
6.5
7.1
ancho =0.7
Pero en este caso la longitud total de los intervalos es Longitud = (7) (0.7)=4.9
Esta longitud excede en 4.9 -4.8= 0.1 al rango, este excedente se puede repartir entre las clase
extremas, por ejemplo, el lmite inferior de la primera clase es 2.25 y el superior 2.25+0.7= 2.95. Para la
segunda clase se considera como lmite inferior el lmite superior de la primera clase, su correspondiente
lmite superior es 2.95+0.7= 3.65, el proceso anterior se repite para cada una de las clases posteriores.
Los resultados son colocados en la siguiente tabla
APUNTES DE ESTADISTICA
Clases
Marca de Frecuencia
Clase
FR(X)
2.6
5
2.25 -2.95
2.95 -3.65
3.3
3.65 - 4. 35
4.0
11
4.35 -5.05
4.7
16
5.05 -5.75
5.4
5.75 -6.45
6.1
6.45 -7.15
6.8
OJIVA
Para algunas aplicaciones es requerido obtener la tabla de las FRECUENCIAS ACUMULADAS la cual
se obtiene sumando las frecuencias precedentes a cada una de las clases. La grfica de las clases vs
las frecuencias acumulas es conocida como OJIVA
EJEMPLOS
3. Utilice el resultado de problema (2) anterior para obtener el histograma, polgono de frecuencias y
ojiva.
SOLUCION:
2.95 -3.65
3.3
10
3.65 - 4. 35
4.0
11
21
4.35 -5.05
4.7
16
37
5.05 -5.75
5.4
43
5.75 -6.45
6.1
48
6.45 -7.15
6.8
50
APUNTES DE ESTADISTICA
A continuacin se presentan cada una de las grficas solicitadas a partir de los datos de la tabla anterior
Histogtrama
20
18
16
frecuencia
14
12
10
8
6
4
2
0
frecuencia
12
10
8
6
4
2
0
APUNTES DE ESTADISTICA
12
10
8
6
4
2
0
Ojiva
50
45
40
frecuencia acumulada
Frecuencia
14
35
30
25
20
15
10
5
0
APUNTES DE ESTADISTICA
0.25
0.2
0.15
0.1
0.05
0
Frecuencia relativa
0.3
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
APUNTES DE ESTADISTICA
4. Se realiza una investigacin a los vendedores de una cadena nacional de tiendas de departamentos
para determinar el patrn de sus ingresos diarios. Se seleccionan una muestra aleatoria de 50
vendedores y se obtienen sus ingresos durante cierto da.
53
63
57
64
58
66
61
67
61
68
69
70
71
72
73
74
74
74
74
77
77
77
78
81
79
79
79
81
78
81
82
82
83
83
84
85
85
86
87
87
88
90
90
90
90
92
93
94
96
97
a) Organice los datos en una tabla. Las clases son 52.5 - 57.5, 57.5 - 62.5, 62.5 - 67.5,.., 92.5 - 97.5
b) Convirtase en frecuencias relativas y relativas acumuladas. Obtngase el Histograma de frecuencias
relativas y la ojiva de frecuencias relativas.
SOLUCION
A partir de los datos y las clases propuestas se determina la siguiente tabla.
Clases
52.5 -57.5
57.5 - 62.5
60
0.0600
0.1000
62.5- 67.5
65
0.0800
0.1800
67.5 -72.5
70
14
0.1000
0.2800
72.5 - 77.5
75
22
0.1600
0.4400
77.5 - 82.5
80
10
32
0.2000
0.6400
82.5 - 87.5
85
40
0.1600
0.8000
87.5 - 92.5
90
46
0.1200
0.9200
92.5 - 97.5
95
50
0.0800
1.0000
APUNTES DE ESTADISTICA
0.25
0.15
0.1
0.05
50
55
60
65
70
75
80
85
90
95
100
Frecuencia relativa
0.2
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
50
55
60
65
70
75
80
85
90
95
100
APUNTES DE ESTADISTICA
a
i =1
= a1 + a 2 + a3 + ... + a N
Como se puede observar es utilizada para representar la suma de de elementos tambin conocida como
serie. A continuacin se presentan algunas de las propiedades ms importantes, las cuales se utilizarn
posteriormente.
Propiedades de la notacin sigma
N
Sean
a1 y
i =1
a)
b)
i =1
i =1
i =1
i =1
(ai + bi ) = ai + bi
N
i =1
i =1
cai = c ai
X =
X
i =1
(1.1)
Es posible dar una justificacin matemtica a la definicin anterior. Para tal fin, supongamos que se
define la funcin D(X) como a continuacin se indica
N
S (a) = ( X i a)
i =1
Donde Xi son los datos y a es una constante, el menor valor de la funcin es S (a ) = 0 , entonces
N
S (a) = ( X i a) = 0
i =1
10
APUNTES DE ESTADISTICA
X a = 0
i
i =1
i =1
X
i =1
Na = 0
Despejando a a
N
a=
X
i =1
X =
f (x )x
i
x =1
n
(1.2)
f (x )
i
N = f i ( xi )
i =1
Entonces
n
X =
f (x )x
i
i =1
(1.3)
MEDIANA X
~
X , es el nmero que divide el conjunto de datos en
N
.
2
~
En el caso de datos agrupados, la mediana se define como el valor X que divide al histograma
correspondiente en dos partes con reas iguales. Para datos agrupados la mediana se pude obtener
mediante
X~ = Li ( x m ) +
N CF ( x )
m 1
2
w
F ( xm )
(1.4)
Donde
Li ( x m )
11
APUNTES DE ESTADISTICA
2
CF ( x m 1 )
F ( xm )
w
MODA X
La moda X es el valor que ms veces aparece en un conjunto de datos.
EJEMPLO
5. Determine media, mediana y moda para la distribucin de frecuencias siguiente y localice sobre el
histograma cada una de ellas sobre el histograma correspondiente.
Clases
F(x)
52.5 -57.5
57.5 - 62.5
62.5- 67.5
67.5 -72.5
72.5 - 77.5
77.5 - 82.5
82.5 - 87.5
87.5 - 92.5
92.5 - 97.5
TOTAL
55
60
65
70
75
80
85
90
95
2
3
4
5
8
10
8
6
4
50
SOLUCION
Es recomendable construir la tabla siguiente a partir de los datos dados:
Clases
52.5 -57.5
57.5 - 62.5
62.5- 67.5
67.5 -72.5
72.5 - 77.5
77.5 - 82.5
82.5 - 87.5
87.5 - 92.5
92.5 - 97.5
TOTAL
55
60
65
70
75
80
85
90
95
F(x)
X F(X)
2
3
4
5
8
10
8
6
4
50
110
180
260
350
600
800
680
540
380
3900
X =
f (x )x
i
i =1
3900
= 78
50
12
APUNTES DE ESTADISTICA
N CF ( x )
50 22
m 1
5 = 79
2
w = 77.5 + 2
F ( xm )
10
La moda es simplemente X = 80
X~ = Li ( x m ) +
La grfica siguiente muestra que las tres medidas de centralizacin, las cuales son muy cercanas entre
si y se localizan como debe ser en el centro del histograma.
Histograma de frecuencia relativa
Frecuencia relativa
0.25
0.2
0.15
0.1
X~
0.05
50
55
60
65
70
75
80
85
90
95
100
MEDIDA DE DISPERSIN
DESVIACIN TPICA ESTNDAR
La desviacin tpica estndar: es la medida de dispersin ms representativa de un conjunto de
datos. .Se define utilizando como
1
2
N
2
(
)
x
x
S N = i =1
N
(1.5)
13
APUNTES DE ESTADISTICA
2
N
2
f ( xi )( xi x )
S N == i =1
N
(1.6)
VARIANZA
El valor de la desviacin estndar al cuadrado es conocido como la Varianza, esto es
Varianza =
S2
Una forma alternativa par el clculo de la varianza y/o de la desviacin estndar sesgada se obtiene
desarrollando la definicin dada, esto es
2
SN =
(x
1
N
1
=
N
1
=
N
1
=
N
=
x)2
1
N
(x
2
i
2 xi x + x 2
( x 2 x x + x )
( x 2 x x + x 1)
( x 2 x N x Nx )
2
2
i
x2
Entonces
2
SN =
1
N
2
i
x2
(1.7)
Notacin
2
Normalmente las letras latinas x , S , S , etc., representan los estadsticos de una muestra y las letras
griegas
, , 2 ,
Existe una forma para la varianza muestral S que proporciona una estimacin ms precisa de la
varianza de la poblacin, en particular, cuando la muestra es pequea (N 36); es conocida como
varianza insesgada de la poblacin y se calcula mediante
2
S N 1 =
(x
x)2
N 1
(1.8)
14
APUNTES DE ESTADISTICA
S N 1
( xi x ) 2 2
=
N 1
(1.9)
Procediendo de manera similar al caso sesgado se puede obtener una frmula directa para calcular la
varianza y/o desviacin estndar insesgada
S N 1
(x
=
x)2
1
2
2
=
xi 2 x i x + x
N 1
N 1
1
2
2
=
xi 2 xi x + x
N
1
2
2
=
xi 2 x xi + x 1
N 1
1
xi x N xi
2
=
xi 2
i N
N
N 1
( xi )2
1
2
=
xi
N
N 1
Por lo tanto
S N 1
( xi )2
1
2
=
xi
N
N 1
(1.10)
La desviacin estndar como se ha indicado anteriormente es una medida de la dispersin de los datos,
est dispersin se mide a partir de la media de la distribucin de datos; por ejemplo, supngase que se
comparan dos conjuntos de datos obtenidos a partir de la misma poblacin, los cuales tienen el mismo
nmero de datos ( N 1 = N 2 ),el mismo promedio ( x1 = x 2 ), entonces, si la desviacin del primer
conjunto es menor que la del segundo conjunto, ( s1 < s 2 ), es posible afirmar que los datos del primer
conjunto se encuentran ms concentrados que los de la segundo y la altura del primer conjunto de datos
es mayor que la del segundo. La figura siguiente compara dos distribuciones continuas con las
caractersticas descritas anteriormente.
15
APUNTES DE ESTADISTICA
0.4
0.35
s1=1
Frecuencia
0.3
0.25
0.2
0.15
s2=2
0.1
0.05
0
-6
x1=x2
-4
-2
Regla de la normal
En muchas ocasiones el histograma que representa la distribucin de frecuencia tiene una forma de
campana simtrica, este tipo de distribucin puede ser comparada con una distribucin terica continua
llamada curva normal. Es posible aplicar las caractersticas de la curva normal a este tipo de
distribuciones muestrales para determinar la proporcin de datos contenidos dentro de una, dos y tres
desviaciones estndar. A continuacin se enuncia la regla de la normal.
Para distribuciones de frecuencia simtricas en forma de campana, aproximadamente el 68 % de los
datos caern en el intervalo
[X
[X S , X + S ],
16
APUNTES DE ESTADISTICA
Frecuencia relativa
0.25
Al menos 3/4
0.2
0.15
0.1
0.05
50
55
60
65
70
75
80
X 2s
85
90
95
100
X + 2s
35
30
25
casi 100%
20
15
Aproximadamente 95%
10
Aproximadamente 68%
5
0
-200
-150
x 3s
-100
-50
x s
x 2s
50
100
[X 2S , X + 2S ], y casi
15
x + s0
200
250
x + 2s
[X S , X + S ],
300
x + 3s
el 95 % en
el 100 % en X 3S , X + 3S .
17
APUNTES DE ESTADISTICA
EJEMPLOS
6. Determine la desviacin estndar sesgada e insesgada para el conjunto de datos siguientes.
X
F(x)
55
60
65
70
75
80
85
90
95
2
3
4
5
8
10
8
6
4
50
SOLUCION
Es recomendable construir la tabla siguiente a partir de los datos dados:
X
F(x)
X F(X)
X2 F(X)
55
60
65
70
75
80
85
90
95
2
3
4
5
8
10
8
6
4
50
110
180
260
350
600
800
680
540
380
3900
6050
10800
16900
39200
45000
64000
57800
48600
36100
309750
SN
1
=
N
1
(309750) 3900 = 111
f ( xi ) xi x =
50
50
2
S N = 111 = 10.54
S N 1
( f ( xi ) xi )2
1
2
=
f ( xi ) xi
N
N 1
1
(3900)2
=
309750
50 1
50
= 113.27
S N = 113.27 = 10.64
18
APUNTES DE ESTADISTICA
57
64
58
66
61
67
61
68
69
70
71
72
73
74
74
74
74
77
77
77
78
81
79
79
79
81
78
81
82
82
83
83
84
85
85
86
87
87
88
90
90
90
90
92
93
94
96
97
SOLUCION
La mediana debe dividir los datos en la mitad, esto es en 25 datos a la izquierda y 25 a la derecha.
Puesto que los datos se encuentran acomodados en orden ascendente, se puede observar el dato X25 =
79 y el dato X26 = 79, por lo tanto
X + X 26 79 + 79
X~ = 25
=
= 79
2
2
8. Cierta tarde del sbado 30 estudiantes universitarios de primer semestre trabajaron.A continuacin se
muestra la distribucin de frecuencias de sus ganancias.
a)
Obtenga la media, mediana y moda
b)
Obtenga la desviacin estndar S n , S n 1
Ganancia
x
Frecuencia
f(x)
10
15
20
25
30
35
2
5
9
6
3
5
30
SOLUCION
Primero se realiza la siguiente tabla a partir de la anterior
x
10
15
20
25
30
35
f(x)
2
5
9
6
3
5
30
xif(xi)
20
75
180
150
90
175
690
f(xi)xi2
200
1125
3600
3750
2700
6125
17500
19
APUNTES DE ESTADISTICA
Promedio
X =
f (x )x
i
690
= 23
30
Mediana
De los datos de la tabla
Lmite inferior de la clase
Li(xm) =17.5
Frecuencia acumulada hasta antes de la clase m
CF ( x m 1 ) m=7
F (xm )
w=5
Ancho de la clase
30
7
N CF ( x )
1
(5) = 22.22
X~ = Li ( x m ) + 2
w = 17.5 + 2
F ( xm )
9
Moda
El valor con mayor frecuencia es x = 20
Desviacin estndar sesgada
2
SN =
1
N
f (x )x
Entonces
x2 =
1
(17500) (23) 2 = 54.33
30
S = 54.33 = 7.37
S 2 n 1 =
( f ( x) xi )
1
2
f ( xi ) xi
N 1
N
Por lo tanto
2
(
690 )
17500
30
30 1
= 56.21
S N 1 = 56.21 = 7.50
20
APUNTES DE ESTADISTICA
2.3
2.3
2.4
2.6
2.8
3.0
3.4
3.5
3.5
3.6
3.7
3.8
3.8
3.9
3.9
4.0
4.0
4.1
4.1
4.3
4.3
4.4
4.4
4.4
4.5
4.5
4.6
4.6
4.6
4.6
4.7
4.8
4.8
4.9
4.9
5.0
5.0
5.1
5.1
5.3
5.4
5.5
5.6
5.7
5.8
5.9
6.0
6.4
6.5
7.1
SOLUCION
(a) Utilizando las clases sugeridas se determinan las respectivas marcas de clase, frecuencias y se
evalan de xf(x) y x2 f(x), acomodando los resultados en la siguiente tabla
clase
2.25-2.95
2.95-3.65
3.65-4.35
4.35-5.05
5.05-5.75
5.75-6.45
6.45-7.15
x
2.6
3.3
4.0
4.7
5.4
6.1
6.8
f(x)
5
5
11
16
7
4
2
50
x(f(x))
13
16.5
44
75.2
37.8
24.4
13.6
224.5
x2(f(x))
33.8
54.45
17.6
353.44
204.12
148.84
92.48
1106.313
frecuencia
12
10
8
6
4
2
0
21
APUNTES DE ESTADISTICA
(b) A partir de los datos de la tabla de frecuencia se puede determinar los estadsticos solicitados
Media
x=
16
x = 4.7
Moda
Mediana
N
dato + dato + 1
2
= 4.5 + 4.5 = 4.5
2
~
x=
2
2
Para los datos agrupados
50
N CF ( x )
21
1
2
(0.7 ) = 4.54
w = 4.35 + 2
F ( xm )
16
X~ = Li ( x m ) +
SN =
1
N
f (x )x
i =1
2
i
x2 =
1
(1063.13) (4.49) 2 = 1.1025
50
Entonces
S = 1.1025 = 1.05
Desviacin estndar insesgada
S N 1
2
(
f i ( x)( xi ) ) 1
(224.5)2
1
f
x
x
(
)
1063
.
13
=
i
i
50
N
N 1
50 1
= 1.125
Por lo tanto
S N 1 = 1.125 = 1.0606
10. Supngase que cierto conjunto de observaciones tiene una x = 100 y una S2= 225
Conteste las siguientes preguntas, de acuerdo al teorema de Tchebycheff.
a)
Al menos qu porcentaje de todas las observaciones caer entre 70 y 130?
b)
A menos que porcentaje de las observaciones caer entre 25 y 175?
SOLUCION
a) De los datos se obtiene
x = 100 S = 15
22
APUNTES DE ESTADISTICA
k=
X x
S
k1 =
70 100
130 100
= 2 y k 2 =
=2
15
15
Proporcin al menos = 1
1
1
100 = 1 2 100 = 75 %
2
k
2
(b) Procediendo de manera similar al inciso anterior, los valores de k correspondientes a 25 y a 175 son
k1 =
25 100
175 100
= 5 y k 2 =
=5
15
15
Proporcin al menos = 1
1
1
100 = 1 2 100 = 96 %
2
k
5
11. De acuerdo con la regla normal Cul es la proporcin aproximada de un conjunto de observaciones
que caer por debajo de x 2 S
SOLUCION
De acuerdo a la regla de la Normal dentro del intervalo
[x 2S , x + 2S ] hay aproximadamente el 95 %
de los datos, quedando fuera el 5 %, pero como solo se consideran los que estn por debajo de x 2 S
esto corresponde a la mitad, o sea al 2.5% equivalentemente a 0.0250 de los datos.
12. Una muestra de 100 trabajadores tiene una produccin promedio por hora de 60 unidades y una
desviacin tpica de 10 unidades. De acuerdo con la regla de la normal, aproximadamente cuntos
trabajadores tienen una produccin entre 40 y 80 unidades?
SOLUCION
El nmero de desviaciones estndar a partir de la media se puede determinar con
Del problema
k1 =
k=
X x
S
40 60
80 60
= 2 y k 2 =
=2
10
10
Lo cual corresponde a dos desviaciones a la izquierda y a la derecha del promedio, que de acuerdo a la
regla de la normal corresponde al 95 % de los datos al 0.95 del total de datos, por lo tanto
Nmero de trabajadores = Total x Fraccin
N = 100 x 0.95 = 95
23
APUNTES DE ESTADISTICA
Unidad II Probabilidad
CONJUNTOS Y LGEBRA DE CONJUNTOS
DEFINICIN DE CONJUNTO.
Conceptos bsicos de la teora de conjuntos:
CONJUNTO: es una coleccin de objetos, datos, que pueden cumplir una o varias condiciones.
Notacin de conjunto: comnmente se representa a los conjuntos mediante letras maysculas A, B, C,
U, Z W, ,
ELEMENTO: en un nico objeto o dato que es parte de un conjunto
Notacin de elemento: los elementos se denotan con letras minsculas a, b, c, , , v, w,
Los conjuntos pueden describirse de dos maneras, de forma explcita y /o implcita.
La forma explcita corresponde cuando los elementos del conjunto son mostrados directamente
EJEMPLO
A = {a, e, i, o, u}
B = {1, 2, 3, 4, 5,6,.}
C = {-4,-2,0, 2, 4,6,.}
La forma implcita corresponde cuando los elementos del conjunto no son mostrados directamente y son
definidos mediante una condicin o condiciones.
A = {x.| x es una vocal del abecedario}
B = {x.| x es un nmero natural}
C = {x.| x es un nmero par}
El CONJUNTO UNIVERSO denotado generalmente por U es el conjunto ms grande que es utilizado
en un problema particular y contiene a todos los elementos.
En el mbito de la Estadstica se relaciona directamente el conjunto universo con la poblacin y el caso
de la Probabilidad con el llamado espacio muestral.
Se dice que un elemento x pertenece a un conjunto A si x es parte del conjunto A.
Notacin:
x .
24
APUNTES DE ESTADISTICA
U
A
x
x .
U
A
x
Un conjunto es finito si se pueden contar sus elementos, esto es, existe un nmero total de elementos.
#A=n
Si el # A =
B A.
U
A
B
25
APUNTES DE ESTADISTICA
Para todo.
Si y solo si.
Entonces.
Existe.
Por lo tanto.
B A x B, x A
Si algn x B pero x A entonces se dir que B NO ESTA CONTENIDO A que B
xB
x A B A.
SUBCONJUNTO de A. En forma compacta:
no es
Notacin: B A.
U
A
B
x
UNIN DE CONJUNTOS
A B =
Notacin:
{x
x A x B}
A B
U
A
26
APUNTES DE ESTADISTICA
EJEMPLO
A = {a, b, c, d }
B = {a, b, c, d , f , g , h}
C = A B = {a, b, c, d , f , g , h}
INTERSECCIN DE CONJUNTOS
A B = {x x A
x B}
A B
Notacin:
U
A
EJEMPLO
A = {a, b, c, d }
B = {a, b, c, d , f , g , h}
A B = {c, d }
COMPLEMENTO
A c = {x x A
Notacin:
x U }
Ac
Ac
U
A
27
APUNTES DE ESTADISTICA
Complemento relativo:
B / A = {x | x B
x A}
Ac
Notacin:
B
A
EJEMPLO
Utilizando los conjuntos anteriores
B / A = { }=
A / B = {g , f , h}
Siendo = {
conjunto vaco
A partir de las operaciones anteriores entre conjuntos se pueden definir y obtener nuevas propiedades
entre conjuntos, las cuales sern utilizadas en secciones posteriores y en particular en el tema de
probabilidad.
Se dice que dos conjuntos A y B son AJENOS si solo si A B = ,
U
A
28
APUNTES DE ESTADISTICA
a)
AA=A
b)
AA=A
c)
A Ac = U
d)
A Ac =
e)
U c=
f)
c = U
g)
A=
h)
A=
i)
A = ( A B) (A Bc)
Si B A. entonces:
j)
AB=A
k)
AB=B
Leyes conmutativas
l)
AB=BA
m)
AB=B A
Leyes distributivas
n)
A ( B C) = (A B) ( C)
o)
A ( B C) = (A B) ( C)
Leyes de Morgan
p)
(A B)c = Ac Bc
q)
(A B)c = Ac Bc
29
APUNTES DE ESTADISTICA
ESPACIO MUESTRAL
El ESPACIO MUESTRAL es el conjunto de todos los resultados posibles de un evento aleatorio
probabilstico.
Normalmente el espacio muestral se representa por la letra S y en trminos de conjuntos es el
equivalente al conjunto universo.
Un EVENTO O SUCESO: es un subconjunto del espacio muestral.
30
APUNTES DE ESTADISTICA
DEFINICIN DE PROBABILIDAD
La PROBABILIDAD DE UN EVENTO se puede definir en el caso de conjuntos finitos como:
P( E ) =
N .(E )
N .(S )
TCNICAS DE CONTEO
PRINCIPIO FUNDAMENTAL DEL CONTEO.
Si un evento n1 se puede realizar de N1 formas y otro evento se puede realizar de N2 formas, entonces el
evento conjunto se puede realizar de N1.N2 formas.
N = N1.N2
(2.1)
El principio fundamental del conteo se puede representar grficamente mediante el llamado diagrama
de rbol. Cada trayectoria en el diagrama de rbol representa un posible resultado o forma de realizarse
el experimento.
En la figura 1 se muestra el diagrama de rbol para el caso de N1=4 y N2 = 2, con lo que se obtienen
N1*N2=4*2= 8 trayectorias formas
Por otra parte el principio fundamental del conteo se puede generalizar a k eventos, esto es, si el evento
i puede ocurrir de Ni formas, entonces el evento total conjunto de los k eventos, se puede realizar de
N1.N2. NiNk formas.
N1
N2
Figura 1. Diagrama de rbol que representa el principio fundamental del conteo N1*N2=4*2= 8
31
APUNTES DE ESTADISTICA
EJEMPLOS
1. Determine el nmero total de combinaciones de un candado formado por formado por 3 discos
giratorios y cada uno de los cuales puede ser colocado en los nmeros 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.
Combinacin de un candado.
SOLUCION
De acuerdo a los indicado en el problema cada uno de los discos pude ser colocado en 10 formas, esto
es N1=10; N2=10, y N3=10. Aplicando el principio fundamental del conteo se obtiene:
10
10
= 103
10
=1000 combinaciones
2. Una moneda es arrojada 2 veces consecutivas. Obtenga el espacio muestral del conjunto.
SOLUCION
Una moneda tiene dos resultados posibles, guila (A) Sol (S), si la moneda es arrojada dos veces
entonces
N = N1*N2 = 2*2 = 4 eventos independientes
Cada uno de los eventos individuales se muestran a continuacin:
S={ (A,A), (A,S), (S,A), (S,S)}
3. Un experimento consiste en arrojar una moneda 4 veces, lstense todas las posibilidades:
SOLUCION
El nmero total de posibles eventos independientes es N=(2, 2, 2, 2)= 24=16
Puede utilizarse un diagrama de rbol para listar correctamente todas las posibilidades, estas son:
A,
A,
A,
S,
A,
A,
A,
A,
A,
S,
A,
A,
A,
A,
S,
S,
A,
S,
A,
A,
S,
S,
A,
S,
A,
S,
A,
S,
S,
A,
A,
S,
A,
S,
S,
A,
A,
S,
S,
S,
S,
S,
S,
S,
S,
S,
S,
32
APUNTES DE ESTADISTICA
4. Obtenga el nmero total de eventos independientes que se obtiene al arrojar una moneda 5 veces
consecutivas.
SOLUCION
En cada uno de los 5 casos de arrojar una moneda est puede tener solamente dos resultados posibles,
guila (A). Sol (S), entonces:
2
=25
=32 posibles
= 62
=36 resultados
10
Letras
26
10
Placas
26
26
=(103) (263)
En el clculo anterior se han incluido placas que no existen para fines prcticos, por ejemplo:
La placa
0
No existe
En general las placas no pueden tener un cero o ceros antes que un nmero diferente de cero.
33
APUNTES DE ESTADISTICA
num
num
letra
letra
letra
No existen
10
26
26
26
= (90)(263)
num
letra
letra
letra
No existen
26
26
26
=(9)(263)
letra
letra
letra
No existen
26
26
26
=263
10
Letras
26
10
Placas
26
26
=(900) (263)
El principio fundamental del conteo permite obtener frmulas matemticas para algunos casos generales
que ocurren comnmente en aplicaciones prcticas, como son, las permutaciones y las combinaciones
PERMUTACIONES
La permutacin aparece cuando se tienen N objetos DISTINGUIBLES SIN REEMPLAZO y estos pueden
ocupar r lugares o posiciones. Lo anterior se representa grficamente como
Lugar 1
Lugar 2 Lugar 1
Lugar 1
Lugar r
34
APUNTES DE ESTADISTICA
Aplicando el principio fundamental del conteo y recordando que en el primer lugar pude ser ocupado por
los n objetos, el segundo lugar por los N-1 restantes y as sucesivamente hasta el lugar r donde
solamente puede ser ocupado por n-r objetos
n
n-1
n-2
n-3
n-r+1
Permutaciones = n(n-1)(n-2)(n-3)(n.-r+1)
Existe un caso particular en el cual en nmero de objetos n es igual al nmero de posiciones que pueden
ocupar, esto es, r = n. por lo tanto el producto anterior se convierte en el producto de los enteros
consecutivos del 1 al n.
n
n-1
n-2
n-3
Permutaciones = n(n-1)(n-2)(n-3)(n.-r)1
Este producto particular es conocido como el FACTORIAL
n! = n(n-1)(n-2)(n-3)(n.-r)..1
(2.2)
nP r =
n!
(n r )!
(2.3)
EJEMPLOS
7. Mostrar que la definicin de las permutaciones en trminos de factoriales es correcta
SOLUCION
Partiendo de la definicin dada
nP r =
n!
n(n 1)(n 2) L (n r + 1)(n r ) L 3 2 1
=
(n r )!
(n r )(n r 1) L 3 2 1
Simplificando trminos
nP r =
n!
= n(n 1)(n 2) L (n r + 1)
(n r )!
35
APUNTES DE ESTADISTICA
nP n =
n!
n!
= = n!
(n n )! 0!
8. Determinar cuantas formas hay de acomodar las letra A,B,C sin reemplazo en tres lugares
consecutivos. Muestre explcitamente cuales son estas posibilidades.
Para el problema n =3 y r =3,
3 P 3 = 3!= 1 2 3 = 6
Explcitamente las permutaciones se pueden obtener a partir del diagrama de rbol siguiente
letra
C
1
=2!
36
APUNTES DE ESTADISTICA
Pero en el bloque formado por las letras A, B estas puede permutarse y mantenerse juntas entre si, por
los que hay que tomar en cuenta est posibilidad donde tambin n =2 r =2
B
=2!
=3!
bloque 2
bloque e
Supngase ahora que se tiene por ejemplo el siguiente acomodo particular de los bloques
3
Matemticas
2
Fsica
=3! 3! 2!
Biologa
Dentro de cada bloque se pueden permutar los libros de cada seccin y tal como se observa se tendran
N2= (3P3)( 3P3)(2P1) =3! 3! 2! Permutaciones
Aplicando el principio fundamental de conteo en nmero total es
N2= 3P3+ 3P3+ =3!
N= N1 N2= 3! (3! 3! 2!)=432
37
APUNTES DE ESTADISTICA
12. Diez personas se encuentran esperando ser atendidas en una oficina de gobierno, pero la secretaria
les informa que solo se atendern a seis personas, cul es la cantidad de posibles opciones para
atender a las personas?
SOLUCION
Para este problema se tienen n = 10 personas y solo se cuenta con r = 6 lugares, entonces
N= nPr = 10P6 =
10!
10!
=
= 151 200 opciones
(10 6)! 4!
COMBINACIONES
Para entender las como se obtienen las combinaciones primero hay que observar lo que sucede cuando
los objetos que son considerados distinguibles se transforman en indistinguibles.
Como ejemplo considere las permutaciones de las letras A, B, C y posteriormente hagamos que A = B
A, B, C diferentes
A = B, C diferente
reduccin
A,
B,
A,
A,
A,
C,
A,
C,
A,
A,
B,
C,
A,
C,
A,
C,
B,
A,
A,
A,
C,
A,
C,
A,
C,
A,
C,
B,
C,
A,
A=B=C
reduccin
A,
B,
A,
A,
A,
C,
A,
A,
B,
C,
A,
A,
A,
B,
A,
A,
A,
C,
A,
A,
A,
C,
B,
a,
A,
,
A
38
APUNTES DE ESTADISTICA
N=
nPr
l1!l 2 !Ll k !
(2.4)
3! 1.2.3
=
=3
2! 1.2
3!
N = =1
3!
N=
EJEMPLO
13. Se tienen 8 libros, 3 de matemticas, 3 de fsica y 2 de biologa. Si los 3 libros de matemticas son
iguales y los 2 de biologa son iguales Cuntas formas posibles existen de acomodarlos en un librero?
SOLUCION
De acuerdo a los datos del problema, n=8 libros , l1 = 3 libros de matemticas iguales, l2 = 2 libros de
biologa iguales, entonces
N=
8! 1.2.3.4.5.6.7.8
=
= 3360
3! 2!
1.2.3.1.2
nCr =
nPr
n!
=
r!
(n r )! r!
(2.5)
n
n!
=
r (n r )! r!
EJEMPLOS
14. Un contratista de construccin ofrece casas con cinco distintos tipos de distribucin, tres tipos de
techo y dos tipos de alfombrado. De cuntas formas diferentes puede un comprador elegir una casa?
SOLUCION
Hay N1= 5 distribuciones N2= 3 tipos de techos y N3= 2 tipos de alfombra, entonces, aplicando el
principio fundamental del conteo
N=
N1
N2
N3
39
APUNTES DE ESTADISTICA
15. Se tiran seis dados. De cuntas formas diferentes pueden quedar las caras hacia arriba?
SOLUCION
Hay 6 posibles resultados de cara para cada uno de los 6 dados, entonces, aplicando el principio
fundamental del conteo
N=
16. Las placas de matrcula de automviles emitidas por cierto estado tienen dos letras seguidas por tres
dgitos. Cuntas placas diferentes pueden emitirse si no hay restricciones?
SOLUCION
Para las letras hay 26 posibles resultados y para los nmeros hay 10 posibles valores, por lo tanto
mediante el principio fundamental del conteo
N=
Num
10
Num
10
=262.103=676000
17. Una clase consiste en diez estudiantes. De cuntas formas puede seleccionarse un comit de tres
estudiantes
SOLUCION
Este problema corresponde a un caso clsico de combinaciones donde n =10 estudiantes, r = 3
estudiantes, entonces
N=
10!
== 120 comits.
(10 3)!3!
18. Un club consta de 30 miembros. 15 blancos, 10 negros y 5 de otras razas. Debe formarse un
comit de 6 miembros. Si los 3 grupos deben estar representados, con proporciones iguales, de
cuntas formas puede hacerse esto?
SOLUCION
Los 30 miembros son divididos en 3 clases:15 blancos, 10 negros, 5 de otros
Como las proporciones deben de ser iguales y el comit est formado por 6 miembros a cada clase le
corresponden 2 miembros para el comit
15
15!
=
= 105 comits de blancos
2 (15 2)! 2!
10
10!
=
= 45 comits de blancos
2 (10 2)! 2!
5
5!
=
= 10 comits de otros
2 (3 2)! 2!
Se pueden elegir
105
45
10
= 47 250 comits
40
APUNTES DE ESTADISTICA
N=
3 hombres de 20
2 mujeres de 10
20
3
10
2
n 30
30!
=
= 142 506 comits.
r 5 (30 5)! 5!
c. Puede haber un comit formado por 5 hombres un comit formado por 5 mujeres, entonces el
resultado es la suma de cada uno de los casos
5 hombres de 20
N=
20
3
5 mujeres de 10
+
10
2
20. Una "mano de pker" consiste en 5 naipes sacados de una baraja ordinaria 52 naipes.
Cuntas manos diferentes pueden formarse a partir de la baraja completa?
SOLUCION
Se tiene n = 52 naipes para seleccionar una combinacin r = 5, entonces
nCr ==
52!
= 2 598.960 manos
(52 5)! 5!
P( E ) =
N .(E )
N .(S )
41
APUNTES DE ESTADISTICA
Es de mencionar que la definicin anterior est dada particularmente para conjuntos finitos y existen
otras definiciones para conjuntos infinitos, por ejemplo par el caso de conjuntos representados mediante
reas, la probabilidad se puede definir como el cociente de el rea que representa al evento E entre el
rea total que representa al espacio muestral.
La probabilidad se puede interpretar como la medida de la ocurrencia de un evento que es parte de un
evento E que es parte de un espacio muestral experimento aleatorio.
EJEMPLOS
21. En una votacin preliminar simulada para determinar la probabilidad de cierto candidato para la
presidencia de los E.U.A., se encontr que 495 de 1000 votantes seleccionados aleatriamente estn a
favor de dicho candidato. Cul es la probabilidad de que cualquiera de los votantes favorezca a este
candidato?
SOLUCION
N (S)= 1000 y N (E)=495 entonces aplicando la definicin directa de la probabilidad
P=
495
= 0.495
1000
22. Supngase que estadsticas recopiladas por la oficina meteorolgica de Los ngeles muestran que
ha llovido durante el desfile de las Rosas en Pasadena 14 veces durante los ltimos 80 aos.
a. Cul es la probabilidad de que llueva durante el desfile de las Rosas el prximo da de ao nuevo?
b. Cul es la probabilidad de que no llueva?
SOLUCION
Si E = { x | x es un ao lluvioso el da del desfile de las Rosas}, entonces
Ec= { x | x es un ao no lluvioso el da del desfile de las Rosas},
Como N (E)=14, entonces N (Ec)= 80-14= 66
N ( E ) 14
7
=
=
N ( S ) 80 40
a)
P( E ) =
b)
P( E c ) =
N ( E c ) 66 33
=
=
N ( S ) 80 40
42
APUNTES DE ESTADISTICA
Por lo tanto
P( E ) =
N (E)
1
=
N ( S ) 142506
24. Sea el espacio muestral S = {arrojan una moneda legal 8 veces} y sea el evento E = {Salen 5 guilas
exactamente}. Determine la probabilidad P (E).
SOLUCION
El nmero de elementos que forman el espacio muestral es:
N(S) =
= 28 = 256
Para determinar el nmero total de elementos que forman el evento E se puede aplicar la ecuacin 4,
en la cual se considera que n = 8, r =8, l1=5 y l2=3.
nPr
8!
=
= 56
l1!l 2 ! 5!3!
N (E) =
Entonces
P( E ) =
N (E ) 56
7
=
=
N (S ) 256 32
25. Una tienda de aparatos de sonido acaba de recibir un embarque de diez nuevos aparatos, siete de
modelo X y tres de modelo Y. Si se venden aleatriamente cuatro aparatos, cul es la probabilidad de
que se vendan dos de cada modelo?
SOLUCION
Hay nx = 7 aparatos tipo X, ny = 3 aparatos tipo Y, se seleccionan r = 4 aparatos, n = nx+ ny=7.
Sea E el es evento de que se vendan dos de cada modelo equivalentemente dos aparatos del modelo
X y dos aparatos del modelo Y, el evento puede representarse como: [X, X, Y, Y]
Se deben de elegir rx = 2 aparatos tipo x de 7 existentes y ry = 2 aparatos tipo Y de 3 existentes,
entonces,
n x n y 7 3
7!
3!
= (21)(3 )= 63
N ( E ) = = =
rx ry 2 2 (7 2)! 2! (3 2)! 2!
y
n 10
10!
N ( S ) = = =
= 210
r 4 (10 4 )! 4!
43
APUNTES DE ESTADISTICA
por lo tanto
P( E ) =
N (E ) 63
3
=
=
N (S ) 210 10
26. Debe seleccionarse un comit de tres personas del consejo directivo de una compaa. El consejo
consta de quince miembros, un tercio de los cuales son mujeres y dos tercios hombres. Cul es la
probabilidad de que las tres personas del comit sean todas del mismo sexo?
SOLUCION
De acuerdo a los datos n =15 personas, nH = 10 hombres y nM = 5 mujeres, se debe selecciona un
comit r = 3 personas
Sean los conjuntos A = {comit de 3 mujeres} y B ={ comit de 3 hombres} entonces
C ={ en comit de personas del mismo sexo}= {las tres personas sean mujeres o sean hombres }
C=AB
Puesto que A B = se tiene que N(C) = N(A) + N(B)
n nM
N (C ) = H +
r r
10!
5!
=
(10 3)! 3! + (5 3)! 3! =120 + 10 =130 comits
n 15
10!
= 455 comits
N ( S ) = = =
r 3 (10 3)! 4!
finalmente
P( E ) =
N (E ) 130 2
=
=
N (S ) 455 7
27. Una "mano de pker consta de cinco naipes. Cul es la probabilidad de que los cinco naipes sean
del mismo palo?
SOLUCION
En un problema previo se sabe que n = 52 cartas, r = 5 cartas y
n 52
52!
N ( S ) = = =
= 2 598 960 manos
r 5 (52 5)! 5!
El mazo de cartas es esta formado por 4 figuras diamantes, corazones, picas y trboles
por lo que cada tipo de figuras est conformado por nP = 13 cartas.
Sea el conjunto
B = {5 cartas del mismo palo} y Ai = {5 cartas del mismo palo tipo i}, para i =1,2,3 y 4.
44
APUNTES DE ESTADISTICA
n 13
13!
=1 287
N ( Ai ) = P = =
r 5 (13 5)! 5!
por lo tanto
13
N ( B) = 4 = 4(1287 ) = 5148
5
P( B) =
5148
33
=
2598960 16660
P4 =
7!
= 840
(7 4)! 4!
b) El caso corresponde a un caso de eleccin con reemplazo donde en cada eleccin se puede
seleccionar cualquiera de las 7 letras para ocupar los 4 lugares, entonces
N = (7) (7) (7) (7)= 74 = 2 401
29. Un vendedor de automviles acaba de recibir un embarque de ocho automvil nuevos, cinco de los
cuales son compactos y tres modelos de lujo. Si se venden aleatriamente cuatro automviles,
obtngase la probabilidad de que se hayan vendido dos de cada modelo
SOLUCION
n =8 automviles 5 compactos, 3 de lujo, se venden r = 4
S={vender 4 modelos de 8 disponibles}
E={2 de cada modelo}={ 2 modelos compactos y 2 modelos de lujo}
8 8!
= 70 Total de posibles ventas
N ( S ) = =
4 4!4!
45
APUNTES DE ESTADISTICA
5! 3!
5 3
N (E ) = =
2 2 3!2! 1! 3!
N (E ) 30 3
P ( A) =
=
= = 0.128
N (S ) 70 7
30. Si en una estacin televisora se debe seleccionar cuatro de entre diez programas de media hora para
emitirlos cada maana de 8:30 a 10:30, de cuntas formas posibles puede arreglarse la programacin?
SOLUCION
De 8:30 a 10:30 solo se pueden acomodar r = 4 programas de media hora, de n = 10 disponibles, como
en la programacin hay orden, entonces el nmero de formas posibles de acomodar la programacin es:
N=
10
P4 =
10!
= 5040
(10 4)! 4!
31. Supngase que una compaa que fabrica relojes y una compaa que fabrica mquinas de escribir
deben elegir para embarcar sus productos entre tren (T), camin (C) y avin (A). Ninguno de los
fabricantes tiene preferencia en cuanto a la forma de envo, de manera que cada resultado es
equiprobable.
a. Mustrese el espacio muestral en un plano bidimensional, sealando las selecciones del fabricante de
relojes en el eje horizontal y las del fabricante de mquinas de escribir en el eje vertical.
b. Cul es la probabilidad de que solamente uno de los fabricantes seleccione avin para el embarque
de sus productos?
SOLUCION
(a) R= FABRICANTE DE RELOJES = { T, C, A}
M= FABRICANTE DE MAQUINAS = { T, C, A}
S = M x R ={ (x, y) | x M y y R |}
= {(T, T), (T, C), (T, A), (C, T), (C, C), (C, A), (A, T), (A, C), (A, A),}
(b) E = {solamente uno de los fabricantes seleccione avin} = { (T, A), (C, A), (A, T), (A, C)}
32. Un comprador de un automvil nuevo puede elegir entre cinco estilos de carrocera, con o sin
transmisin automtica, con o sin aire acondicionado, con o sin asientos individuales y entre diez
colores. De cuntas formas puede realizar su eleccin el comprador?
SOLUCION
Aplicando directamente el principio fundamental del conteo
N1=5
N2=2
N3=2
N4=2
N5=10
carrozas (carroceras)
transmisin automtica
aire acondicionado
asientos individuales
colores
N = N1 N2 N3 N4 N5 =(5).(2).(2).(2).(10)=400
46
APUNTES DE ESTADISTICA
33. De cuntas formas puede elegirse un cuarteto (grupo de cuatro jugadores) de entre doce miembros
de un club de golf?
SOLUCION
El problema corresponde directamente a el caso tpico de combinaciones donde n =12 y r = 4,
entonces
12
C4 =
12!
= 495
(12 4)!4!
34. Si 20 estaciones de servicio constituyen una poblacin, cul es la probabilidad de que se seleccione
como muestra aleatoria una combinacin de cuatro estaciones en particular?
SOLUCION
Para el problema n =20 y r = 4, entonces
20 C 4 =
20!
2.432902008 x1018
=
= 4845
(20 4)!4! 2.092278989 x10 3 (24)
P=
1
= 2.06 x10 4
4845
P ( A) =
#A
#S
evento seguro
b) P ( )=0
evento imposible
c) 0 P (E) 1
Es importante resaltar la propiedad c) ya que seala que ningn evento puede de ninguna manera tener
una probabilidad negativa ni nunca puede ser mayor que la unidad. Por lo tanto, si al resolver algn
problema se obtiene una probabilidad que no cumpla la propiedad c) se pude afirmar que el problema
est mal resuelto.
(2.6)
i, j =1,2,3,.,n, entonces
(2.7)
47
APUNTES DE ESTADISTICA
1= P(A) +P(Ac)
Despejando a P(A)
P(A) = 1- P(Ac)
(2.8)
(2.9)
(2.10)
P(E2)=1/8,
48
APUNTES DE ESTADISTICA
36. En el problema anterior, si A denota al evento de que ocurran dos o ms soles y B denota al evento
de que ocurran dos o menos soles, cul es la probabilidad de que ocurra ya sea A o B? Esto es
cunto es, vale P(AUB)?.
SOLUCION
Del espacio muestral del problema anterior se tiene que
A= {2 ms soles} ={ASS, SAS, SSA, SSS}
B= {2 menos soles} ={ASS, SAS, SSA, AAS, ASA, SAA, AAA}
AB={ ASS, SAS, SSA }
Debido a que los conjuntos no son ajenos, se debe aplicar la ecuacin (8)
P(AUB) = P(A)+P(B)-P(AUB) = 4/8+7/8-3/8=1
37. Supngase que una bolsa contiene 10 esferas marcadas 1, 2, 3,. . ., 10. Sea E el evento de extraer
una esfera marcada con un nmero par y F el evento de extraer una esfera marcada con un nmero 5 o
mayor. Son E y F mutuamente excluyentes? Obtngase P(E U F).
SOLUCION
El espacio muestral y cada uno de los eventos se describen a continuacin
S={extraer una esfera marcada del 1 al 10} = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
E={par}={2, 4, 6, 8, 10}
F={5 mayor}={5, 6, 7, 8, 9, 10}
Para que los eventos sena excluyente se debe tener que P(EF)=P(E) P(F)
Como EF = {6, 8, 10}
49
APUNTES DE ESTADISTICA
P(A) =0.8
P(B) =0.8
P(AB) =0.7
0
0.05
1
0.10
2
0.18
3
0.25
4
0.20
5
0.22
50
APUNTES DE ESTADISTICA
0.25
0.20
0.22
51
APUNTES DE ESTADISTICA
(3.1)
En el caso de que la ocurrencia de un evento A afecte la ocurrencia del evento B entonces se tiene el
caso de EVENTOS DEPENDIENTES de la PROBABILIDAD CONDICIONAL, la cual se denota por:
P(B A)
En general la probabilidad de la interseccin de los eventos AB, cuando son dependientes se obtiene
mediante la expresin:
P(AB)= P(A)P(B A).
(3.2)
P( A B )
P ( A)
(3.3)
P ( B | A) =
EJEMPLOS
1. Determine si los eventos A = {sol en la primera tirada} B = {sol en la segunda tirada} son
independientes en el experimento de arrojar una moneda dos veces.
SOLUCION
El espacio muestral del problema es S ={(S,S), (S,A), (A,S), (A,A)}
Para la parte izquierda de la ecuacin (10)
E = {dos soles al arrojar una moneda dos veces} = AB = ={(S,S)}
P(AB)=N(E)/N(S)= 1/4
Para la parte derecha de la ecuacin (10)
P{A}=1/2
P{B}= 1/2
P(A).P(B)=(1/2)(1/2)=1/4
Entonces se cumple que P(AB) = P(A).P(B), por lo que los eventos son independientes.
52
APUNTES DE ESTADISTICA
2. Una caja contiene diez esferas. Cinco de ellas son blancas, tres rojas y dos negras. Se selecciona
aleatriamente una esfera .sin reemplazo.
a. Cul es la probabilidad de extraer dos esferas blancas una despus de otra?
b. Cul es la probabilidad de extraer una esfera roja y despus una negra?
c. Cul es la probabilidad de extraer tres esferas rojas, una despus de otra?
d. Cul es la probabilidad de extraer una esfera negra, despus un roja y finalmente un blanca?
SOLUCION
Los datos del problema son: total de esferas n =10 repartidas en 5 blancas, 3 rojas y 2 negras.
El experimento se realiza sin reemplazo, por lo que los eventos son dependientes
Definiendo los siguientes conjuntos
B1 = {Sacar bola blanca en la 1 extraccin}
B2 = {Sacar bola blanca en la 2 extraccin}
B3 = {Sacar bola blanca en la 3 extraccin}
R1 = {Sacar bola roja en la 1 extraccin}
R2 = {Sacar bola roja en la 2 extraccin}
R3 = {Sacar bola roja en la 3 extraccin}
N1 = {Sacar bola negra en la 1 extraccin}
N2 = {Sacar bola negra en la 2 extraccin}
(a) P({2 blancas una despus de la otra})= P(B1 B2)= P(B1) P(B2 B1)= (5/10)(4/9) =2/9
(b) P({Una roja y una negra})= P(R1 N2)= P(R1) P(N2 R1) = (3/10)(2/9) =1/15
(c) P({Tres rojas despus de otra}) = P(R1).P(R2R1).P(R3R2R1)=(3/10)(2/9)(1/8)= 1/120
(d) P({ Negra, despus roja, y finalmente blanca}) = P(R1).P(R2R1).P(R3R2R1) = (3/10) (2/9)(5/8) =
1/24
3. El Sr. Huerta y su esposa tienen 55 y 50 aos de edad, respectivamente. Si la probabilidad de que un
hombre de 55 aos de edad viva al menos otros 15 aos es de 0.70, y la probabilidad de que una mujer
de 50 aos de edad viva al menos otros 15 aos es de 0.85, cul es la probabilidad de que tanto el Sr.
Huerta como su esposa continen vivos dentro de 15 aos? (Considrese que las longevidades del
esposo y esposa son independientes.)
SOLUCION
Se definen los eventos:
A={el seor viva ms de 15 aos }, entonces, P(A)=0.70
B={la seora viva ms de 15 aos }, entonces P(B)=0.85
Entonces C = A U B = {El seor y la seora vivan ms 15 de aos}
Considerando los eventos independientes se tiene que P(AB)=P(A).P(B) = (0.70)(0.85)=0.595
P(C)= P(AUB)=P(A)+P(B)-P(AB) = 0.70+0.85 -0.595= 9.995
4. Se dispone de dos mquinas contra incendios para casos de emergencia. La probabilidad de que
cualesquier de las dos mquinas est lista cuando se necesite es de 90%. Se considera que la
disponibilidad de una mquina es independiente de la otra. a. En el caso de una alarma por incendio,
cul es la probabilidad de que ambas mquinas estn listas? b. Cules la probabilidad de que ambas
mquinas no estn listas? c. Cul es la probabilidad de que solamente una mquina est lista?
53
APUNTES DE ESTADISTICA
SOLUCION
Es conveniente definir los eventos
A={la mquina 1 est lista}
B={la mquina 2 est lista }
P(A)=0.9
P(B)=0.9
Entonces, cada uno de los incisos se puede resolver como se indica a continuacin
a)
P(AB)=P(A).P(B)=(0.9)(0.9==0.81
b)
P(AcBc)=P(Ac).P(Bc)=(1-P(A)(1-P(B)=(0.1)(0.1)=0.01
c)
El evento de que al menos una de las mquinas est disponible es C = (ABc)U(AcB)
P(C) = P((ABc)U(AcB))= P(ABc)+ P(AcB)- P(AB) (AcB)
=P(A).P(Bc)+P(Ac)P(B) = (0.9)(1-0.9)+(1-0.9)(0.9) = 0.09+0.09=0.18
5. A continuacin se encuentra una tabla probabilstica acerca del sexo y el estado civil de los empleados
de una gran institucin.
Mujeres
F
Hombres
F
Total
Estado civil
Casados (M)
0.42
0.18
0.60
Solteros (M)
0.28
0.12
0.40
Total
0.70
0.30
1.0
P (M I F)=P(MF)/P(F)=0.42/0.70=0.6
P (M I F)=P(MF)/P(F)=0.18/0.30=0.6
P (M)=0.6
Entonces
P (M I F)= P (M I F)= P (M)
(c)
P (F I M)=P(FM)/P(M)=0.42/0.60=0.7
P (F I M)= P(FM)/P(M)=0.28/0.4=0.7
P (F)=0.7
Entonces
P (F I M)= P(F I M)= P(F)
(d)
P (M I F)=P(MF)/P(F)=0.28/0.70=0.4
P(M I F)= P(MF)/P(F)=0.12/0.30=0.4
P(M)=0.4
Entonces
P (M I F) = P(M I F) = P(M)=0.4
(e)
P (F I M)=P(FM)/P(M)=0.18/0.60=0.3
P (F I M) = P(FM)/P(M)=0.12/0.4=0.3
P (F)=0.3
Entonces
P (F I M) = P (F I M) = P (F)=0.3
54
APUNTES DE ESTADISTICA
Como se observa de cada uno de los incisos anteriores, los eventos de sexo y estado civil son
independientes uno del otro.
6. Se extraen naipes de una baraja ordinaria. Si los naipes que se han extrado no se reemplazan antes
de extraer el siguiente, cul es la probabilidad de extraer
a. Cuatro ases y despus cualesquier de los otros naipes;
b. Tres ases y despus dos reyes;
c. Cinco naipes del mismo palo?
SOLUCION
a)
55
APUNTES DE ESTADISTICA
P(T| S) = 0.70
P(T| S') = 0.40
P(S)=0.2
P(T|S)=0.7
P(T|S)=0.6
P(S T)=0.06
P(S T)=0.14
P(S T)=0.48
P(S)=0.8
P(T|S)=0.4
P(S T)=0.32
56
APUNTES DE ESTADISTICA
P (S T ) 0.06 1
=
=
P(T )
0.54 9
P(S 'T ') 0.32 16
=
=
P(T ')
0.46 23
9. En una encuesta aplicada a los estudiantes que se gradan en el colegio de cierta comunidad, se
determin que el 40% de los estudiantes continuarn estudiando alguna especializacin en otra
universidad (T) y el 60% no lo harn (T'). Dadas estas dos categoras de estudiantes, la proporcin de
estudiantes que han obtenido calificaciones promedio de A, B y C o menos se muestran a continuacin,
Estudiantes
T
T
Calificaciones promedio
A
B
C o menos
0.10
0.30
0 60
0.05
0.40
0.55
TOTAL
1
1
57
APUNTES DE ESTADISTICA
(a) P (T | A) =
P(T A) 0.04 4
=
=
P ( A)
0.07 7
(b) P (T ' | B ) =
Y que adems U Ai = S
l =i
Por lo tanto cualquier conjunto B puede ser representado por los A1, A2, A3,An de la forma:
n
B = U ( Ai I B ) = ( A1 U B ) U ( A2 I B ) U ... U ( An I B )
l =i
Entonces
P(B)= P(A1B)+P(A2B)++P(AnB)
Adems como
P( Ai B ) P(B Ai )
=
P (B )
P (B )
P( Ai ) P(B | Ai )
=
P( A1 ) P(B | A1 ) + P ( A2 ) P(B | A2 ) + K + P ( An ) P(B | An )
P ( Ai | B) =
(3.4)
La ecuacin anterior establece un forma para invertir la probabilidad condicional, esto es se puede pasar
de P(B | A1) a P(A1 | B).
EJEMPLOS
10. Una gran caja contiene transistores fabricados en tres mquinas. La mquina A es el doble de rpida
que la mquina B o C. La tasa de defectos para la mquina A es 0.02 para B es 0.04 y para C es 0. 02.
Se selecciona al azar un transistor de la caja y resulta defectuoso.
Cul es la probabilidad de que la haya producido la mquina C?
58
APUNTES DE ESTADISTICA
SOLUCION
El uso de un diagrama de rbol es til para representar los datos y calcular la probabilidad conjunta
P(D|A)=0.02
P(A D)=0.01
P(A)=0.50
P(D|B)=0.04
P(B D)=0.01
P(B)=0.25
P(D|C)=0.02
P(CD)=0.005
P(C)=0.25
P (C | D) =
P (C ) P(D | C )
P( A) P(D | A) + P ( B ) P(D | B ) + P (C ) P(D | C )
P (C | D) =
(0.25)(0.02)
1
= = 0.20
(0.50)(0.02) + (0.25)(0.04) + (0.25)(0.02) 5
11. Una vendedora realiza su trabajo haciendo visitas domiciliarias. Durante los aos de experiencia
ha acumulado los siguientes datos: de todas las visitas realizadas el 15% dieron como resultado lo
que ella considera como grandes ventas (L), 30% ventas pequeas (S) y 55% no fueron ventas (N).
Adems, de aquellos que hicieron grandes compras, el 75% viven en casas unifamiliares de dos
pisos (T); de los que realizaron pequeas compras, el 50% viven en casas de este tipo; entre
quienes no realizaron compras el 30% viven en casas de este tipo. Si la siguiente casa que visita es
una casa unifamiliar de dos pisos, cul es la probabilidad de que d como resultado una gran venta?
Una venta pequea? Ninguna venta?
SOLUCION
Representando los resultados en un diagrama de rbol
P(T|L)=0.75
P(L T)=0.1125
P(T|S)=0.50
P(S T)=0.150
P(L)=0.15
P(S)=0.30
P(T|N)=0.30
P(NT)=0.165
P(N)=0.55
59
APUNTES DE ESTADISTICA
P( L | T ) =
P( L) P (T | L )
0.1125
0.1125 5
=
=
=
P ( L) P(T | L ) + P ( S ) P(T | S ) + P( N ) P(T | N ) 0.1125 + 0.150 + 0.165 0.4275 19
P( S | T ) =
P ( S ) P(T | S )
0.150
0.150 20
=
=
=
P ( L) P(T | L ) + P ( S ) P(T | S ) + P ( N ) P(T | N ) 0.1125 + 0.150 + 0.165 0.4275 57
P( N | T ) =
P ( N ) P(T | N )
0.165
0.165 22
=
=
=
P( L) P(T | L ) + P ( S ) P(T | S ) + P( N ) P(T | N ) 0.1125 + 0.150 + 0.165 0.4275 57
12. Como muchos saben la hepatitis se detecta comnmente realizando pruebas sanguneas.
Supngase que en un cierto grupo de personas, el 30% realmente tiene hepatitis (H) y el 97% no
(H'). Supngase adems que si una persona tiene la enfermedad, el 95% de las pruebas sanguneas
la detectan (P), pero el 5% no la detectan (N). Para las personas que no tienen la enfermedad, el 6%
de las pruebas muestran resultados positivos y el 94% muestran resultados negativos. Si la prueba
sangunea de una persona es negativa, cul es la probabilidad de que en realidad tenga la
enfermedad?
SOLUCION
Representando los resultados en un diagrama de rbol
P(P|H)=0.95
P(H)=0.03
P(N|H)=0.05
P(P|H)=0.06
P(H P)=0.0285
P(H N)=0.0015
P(H P)=0.0582
P(H)=0.97
P(N|H)=0.94
Entonces
P( H | N ) =
P(H N)=0.9118
P( H ) P(N | H )
0.0015
0.0015
=
=
= 1.6451 10 3
P( H ) P (N | H ) + P ( H ' ) P( N | H ') 0.0015 + 0.9118 0.9133
60
APUNTES DE ESTADISTICA
VARIABLES ALEATORIAS
Una funcin es una asociacin tal que a cada elemento X de un conjunto llamado dominio le asocia un
nico elemento Y de otro conjunto llamado rango.
La variable X se les conoce como variable independiente y la variable Y como variable dependiente.
La variable aleatoria es una funcin que asigna valores numricos a los resultados de un experimento
aleatorio. La variable aleatoria se denota normalmente con letras maysculas X, Y, Z,, etc.
k = 1, 2, 3, K,
P( X = x k )
Es posible entonces definir una funcin de probabilidad para la variable aleatoria discreta como:
f ( x k ) = P( X = x k )
k = 1, 2, 3, K,
(3.5)
f ( x) = P( X = x)
En general se dice que una funcin
propiedades
x [a, b]
(3.6)
0 f ( x k ) 1 para k = 1, 2, 3,K ,
f (x
k
) = 1 para k = 1, 2, 3, K,
0 f ( x) 1 para x [a, b]
f ( x) dx = 1 para x [a, b]
61
APUNTES DE ESTADISTICA
F ( x) = P( X x )
Lo cual se traduce para el caso discreto en
F ( x) = f ( x j )
jk
F ( x ) = f ( x) dx
x
Las ideas anteriores pueden generalizarse para el caso de ms variables aleatorias, por ejemplo, para el
caso de dos variables aleatorias X y Y, se define la funcin de probabilidad conjunta como
f ( x, y ) = P ( X = x, Y = y )
Donde la funcin
(a)
(b)
(3.7)
0 f ( x j , y k ) 1 para j = 1, 2, 3, K, y k = 1, 2, 3, K,
f ( x
j
(b)
Se dice que dos variables aleatorias Y y Y discretas son variables aleatorias independientes si y solo
si los eventos X=x y Y=y son independientes para todo x ,y. Para este caso se dice que la distribucin
conjunta de probabilidad satisface
P( X = x, Y = y ) = P( X = x) P(Y = y )
o de igual forma
f ( x, y ) = f ( x ) f ( y )
VALOR ESPERADO DE LA DISTRIBUCIN DE PROBABILIDAD
Un concepto importante para las distribuciones de probabilidad es el valor esperado esperanza
matemtica la cual se define como:
n
E ( X ) = f ( xi ) xi
(3.8)
i =1
62
APUNTES DE ESTADISTICA
E ( X ) = x f ( x) dx
(3.9)
de la distribucin de
(b)
(c)
E (cX ) = cE ( X )
E ( X + Y ) = E ( X ) + E (Y )
E ( XY ) = E ( X ) E (Y )
Var ( X ) = E (( X ) 2 )
La varianza Var ( X ) se relaciona con la desviacin tpica de una variable aleatoria
= Var ( X ) .
2
X
(3.10)
mediante
Por lo que la varianza puede ser representada mediante cualquiera de las notaciones
anteriores.
Por su definicin la varianza nunca puede tomar valores negativos, y su interpretacin es idntica a la
que se dio para la distribuciones de frecuencia en la seccin de la estadstica descriptiva.
Desarrollando la definicin anterior y aplicando las propiedades de la esperanza matemtica
2 = E (X 2 ) 2
(3.11)
X2 = x k 2 f ( x k ) 2
(3.12)
X2 = x 2 f ( x )dx 2
(3.13)
i =k
y para el continuo
b
63
APUNTES DE ESTADISTICA
Propiedades de la Varianza
(a)
(b)
(c)
2 X Y = 2 Y + 2 Y
EJEMPLOS
13. Se dice que un juego es legal si al jugar el juego el valor esperado de ganar perder es cero. Diga
usted si el juego de los volados con una moneda balanceada es un juego legal.
SOLUCION
El juego consiste en lo siguiente:
- Se tira la moneda, la persona pide sol y cae sol, gana 1 peso.
- Se tira la moneda, la persona pide guila y cae guila, gana 1 peso.
- Se tira la moneda, la persona pide sol y cae guila, pierde 1 peso.
- Se tira la moneda, la persona pide guila y cae sol, pierde 1 peso.
La variable aleatoria del experimento se puede definir como X = {-1, 1}
Definiendo los eventos S1={la persona pide sol}, S2=={cae sol}
A1={la persona pide guila}, A2=={cae guila}
Entonces las respectivas probabilidades de cada valor de la variable aleatoria son:
f(1)= P(X=1)=P(S1S2)+P(A1A2)=P(S1).P(S2)+P(A1).P(A2)=(1/2) (1/2) +(1/2) (1/2)= (1/2)
f(-1)= P(X=-1)=P(S1A2)+P(A1S2)=P(S1).P(A2)+P(A1).P(S2)=(1/2) (1/2) +(1/2) (1/2)= (1/2)
Los resultados generalmente se pueden acomodar para las variables discretas en una tabla
-1
f(x)
De la tabla anterior se puede calcular la esperanza matemtica del experimento
n
64
APUNTES DE ESTADISTICA
= E ( x) = xi f ( xi ) = 0(1/4)+1(1/2+2(1/4)=1
i =1
E ( x 2 ) = xi f ( xi ) = 02(1/4)+12(1/2)+22(1/4)=1/2+1=3/2
2
i =1
15. En un estudio acerca de las actitudes de los consumidores hacia cierto producto nuevo, se pregunta
lo siguiente: "Le agrada el nuevo producto?" Para esta pregunta hay solamente dos posibles
respuestas, "s" y "no", a las cuales se les asignan los valores de 1 y 0, respectivamente. Sea p la
probabilidad de que ocurra el evento de una respuesta "s". (a) Cul es la distribucin probabilstica de
W, variable aleatoria de este experimento?, (b) su Valor esperado y (c) su desviacin tpica.
SOLUCION
(a) De acuerdo a los datos del problema, la variable aleatoria W toma los valores W = {0, 1} y
f(1)=P(X = 1) = p
Como
f (x
) = 1 , entonces
f(0)+f(1) = 1
f(0)=1 - f(1)=1-p
f(W) 1-p
(b) E ( X ) =
1
p
x
i =1
(c)
entonces
X =
p (1 p )
16. Sea X la variable aleatoria correspondiente al nmero de soles obtenidas en la tirada de cuatro
monedas balanceadas. Obtngase la distribucin probabilstica de X. y su valor esperado.
SOLUCION
De la definicin de la variable aleatoria se tiene que X = {0, 1, 2, 3, 4}
65
APUNTES DE ESTADISTICA
En general para un evento cualquiera de arrojar una moneda balanceada n veces la probabilidad de
cada evento simple es:
P( E ) =
1
2n
Por otra parte, si en el evento se lanzar n monedas y aparecen r soles, entonces aparecern n-r guilas
y el nmero de eventos simples que contienen r soles se determina utilizando las tcnicas de conteo:
n!
r ! (n r )!
Entonces la probabilidad de que ocurran en n tiradas r soles es
P (r soles ) =
n!
1
r ! (n r )! 2 n
Aplicando el resultado anterior para cada uno de los valores de la variable aleaoria
4!
1
1
=
4
0 ! (4 0)! 2
16
4!
1
4 1
f (1) = P( X = 1) =
=
=
4
1 ! (4 1)! 2
16 4
4!
1
6 3
f (2) = P( X = 2) =
=
=
4
2 ! (4 2)! 2
16 8
4!
1
4 1
f (3) = P( X = 3) =
=
=
4
3 ! (4 3)! 2
16 4
4!
1
1
f (4) = P ( X = 4) =
=
4
4 ! (4 4)! 2
16
f (0) = P( X = 0) =
f(x) 1/16
1/4
3/8
1/4
1/16
E ( X ) = xi f ( xi ) = (0) (1/16) + (1) (1/4) +(2) (3/8) + (3) (1/4)= (4) (1/16) = 2.
i =1
17. Sea X la variable aleatoria correspondiente al nmero de caras obtenidas en la tirada de cuatro
monedas balanceadas. a. Obtngase la distribucin probabilstica de X. b. La media de la distribucin. c.
La desviacin tpica.
SOLUCION
(a) El espacio muestral del experimento es
S = { (1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1), (3,2), (3,3), (3,4), (3,5),
(3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5),
(6,6) }
66
APUNTES DE ESTADISTICA
Entonces los valores posibles de la variable aleatoria son X = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} y sus
respectivas probabilidades se pueden calcular directamente del espacio muestral
f (2) = P( X = 2) =
1
36
f (3) = P( X = 3) =
2
1
=
36 18
f (4) = P ( X = 4) =
3
1
=
36 12
f (5) = P ( X = 5) =
4 1
=
36 9
f (6) = P( X = 6) =
5
36
f (7) = P ( X = 7 ) =
6 1
=
36 6
f (8) = P( X = 6) =
5
36
f (9) = P( X = 9) =
4 1
=
36 9
f (10) = P( X = 10) =
f (11) = P( X = 11) =
2
1
=
36 18
f (12) = P( X = 12) =
3
1
=
36 12
1
36
2
1/36
3
1/18
4
1/12
5
1/9
6
5/56
7
1/6
8
5/56
9
1/9
10
1/12
11
1/18
12
1/36
(b)
= xi f ( xi ) = (2) (1/36) + (3) (1/18)+ (4) (1/12) + (5) (1/9)+ (6) (5/36) + (7) (1/6)+
i =1
+ (8) (5/36) + (9) (1/9)+ (10) (1/12) + (11) (1/18)+ (12) (1/36) = 7.
n
(c)
X2 = x k 2 f ( x k ) 2
i=k
= (2)2 (1/36) + (3)2 (1/18)+ (4)2 (1/12) + (5)2 (1/9)+ (6)2 (5/36) + (7)2 (1/6)+ (8)2 (5/36) +
(9)2 (1/9)+ (10)2 (1/12) + (11)2 (1/18)+ (12)2 (1/36) -72= .35/6 = 5.83333
entonces
X =2.4152
18. Un juego llamado CHICOS Y GRANDES consiste primero en arrojar dos dados y se suman los
puntos de sus caras. Los resultados de la suma son divididos en CHICOS si su valor es menor que
siete, CASA si cae siete y GRANDES si valor es mayor que siete, tal como se muestra en la higiene
figura
2, 3, 4, 5, 6
chicos
7
Casa
8, 9, 10, 11, 12
grande
67
APUNTES DE ESTADISTICA
f.
2
1/36
3
1/18
4
1/12
5
1/9
6
5/56
7
1/6
8
5/56
9
1/9
10
1/12
11
1/18
12
1/36
-1
= xi f ( xi ) = -1(5/8)+1(25/72)+2(1/36)=-5/18+1/8=-2/9= -0.222
i =1
Como el resultado es negativo el juego no solamente no es legal sino que es desfavorable al jugador.
19. Un vendedor ofrece dos modelos distintos de receptores de estreo, H y T. Considrese que los dos
modelos son igualmente populares: el 50% de todos los posibles compradores prefieren el Modelo H y el
50% prefieren el Modelo T. Adems, considrese que el vendedor tiene en existencia tres receptores de
cada modelo y que en un solo da se venden tres receptores.
a. Defnase la variable aleatoria de este experimento.
b. Cul es la distribucin probabilstica de la variable aleatoria?
SOLUCION
En total hay n = 6 receptores, 3 modelo H y 3 modelo T y la venta o seleccin consiste en r =3 aparatos
(a) La variable aleatoria X del experimento es el nmero de aparatos tipo H vendidos, entonces si la
venta consiste solamente de 3 aparatos X puede tomar los siguientes valores: X = {0, 1, 2, 3},
(b) Las probabidades de la variable aleatoria X se determinan mediante las tcnicas de conteo
f (0) =
C3
1
=
20
6 C3
3
f (0) =
C 2 3 C1 (3)(3) 9
=
=
20
20
6 C3
68
APUNTES DE ESTADISTICA
f (2) =
C1 3 C 2 (3)(3) 9
=
=
20
20
6 C3
f (3) =
C3
1
=
20
6 C3
3
20. La inversin realizada por el Sr. Aranda podran dar como resulta siguientes beneficios, con las
probabilidades indicadas:
Beneficio
$1 milln
2 millones
3 millones
4 millones
5 millones
Total
Probabilidad
0.2
0.3
0.2
0.2
0.1
1.0
= xi f ( xi ) = (1) (0.2) + (2) (0.3)+ (3) (0.2) + (4) (0.2)+ (5) (0.1) = 2.7 millones
i =1
E ( x 2 ) = X i f ( xi ) = 12(0.2)+22(0.3)+32(0.4)+42(0.2)+52(0.1)=8.9 millones
2
i =1
x2 = E ( x 2 ) 2 = 8.9-2.72 = 1.61.
x = 1.61 = 1.27 millones
21. Supngase que un aparato de televisin tiene ocho bulbos, dos de los cuales dos son
defectuosos. Se seleccionan sucesivamente dos bulbos y se quitan del aparato para
inspeccionarlos. Sea X el nmero de bulbos defectuosos en la muestra de dos bulbos. Cul es el
valor esperado de X y su respectiva desviacin tpica?
SOLUCION
El nmero total de bulbos es n = 8 tubos, 2 defectuosos 6 sin defecto. La muestra a considerar es r =2.
La variable aleatoria es X = {No. de defectuosos en la muestra}={0, 1, 2}
f(0) = P(X = 0)=
C 2 15
=
28
8 C2
6
69
APUNTES DE ESTADISTICA
f(1)=P(X =1)=
C1 ( 6 C1 ) 12
=
28
8 C2
C2
1
=
28
8 C2
2
= E ( x) = xi f ( xi ) =0(15/28)+1(12/28)+2(1/28)=1/2
E ( x 2 ) = xi f ( xi ) =02(15/28)+12(12/28)+22(1/28)=4/7
2
x = 9 / 28 =
3
28
= 0.5666
22. Un jugador arroja tres monedas ideales. Gana $3 si ocurren tres caras, $2~ ocurren dos caras y $1 si
ocurre una cara. Si el juego es justo, cunto debera pagar si no aparece ninguna cara?
SOLUCION
La distribucin de probabilidad del experimento de arrojar tres monedas legales es
x
y1
y1=-12
70
APUNTES DE ESTADISTICA
23. Supngase que se van a vender 10 000 boletos a $1 cada uno en una lotera realizada para ayudar
en las investigaciones contra el cncer. El premio es un automvil con valor de $ 4000. Si usted compr
cinco boletos, cul es su contribucin esperada a la investigacin en contra del cncer?
SOLUCION
Debido a que solamente se compran 5 de los 1000 boletos la probabilidad
de ganar es
P(ganar)=5/10000
y la de perder
P(perder)=9995/10000
El premio es 4000 pesos pero, se resta 5 porque se ha pagado por el boleto 4000-5=3995
y la perdida es 5.
La variable aleatoria del experimento Y es la ganancia y/o prdida, Y ={-5 3995 }, entonces la
correspondiente distribucin de probabilidad de Y es
y
-5
3995
f(y)
9995/10000
5/10000
Considrese una poblacin compuesta por los siguientes elementos P = {1, 3, 5, 7}, los cuales tiene una
distribucin de probabilidad uniforme, esto es, todos los elementos tienen la misma probabilidad de ser
seleccionados), lo anterior es mostrado en la siguiente tabla de distribucin de probabilidad
x
p(x) 1/4
1/4
1/4
1/4
X = E ( X ) = xi f ( xi ) = 1(1/4)+3(1/4)+5(1/4)+7(1/4)=16/4=4
X2 = E ( xi ) 2 E ( x) 2
1
1
1
1
2
= xi2 f ( x) X = 12 + 3 2 + 5 2 + 7 2 4 2 = 5
4
4
4
4
Supngase ahora que se realiza el experimento de seleccionar una muestra de dos nmeros (X1, X2)
de la poblacin anterior con reemplazo y adems se define la variable aleatoria
X =
(X 1 + X 2 )
2
(el
promedio de los valores resultantes). Se pueden obtener un nmero infinito de muestras, pero muchas
71
APUNTES DE ESTADISTICA
de la muestra obtenidas sern idnticas, es decir tendrn el mismo resultado, aplicando las tcnicas de
conteo se sabe que hay solamente
4
Diferentes muestras.
=16
X = {1, 2, 3, 4, 5, 6,7}
Con los resultados anteriores es posible construir una distribucin de probabilidad para la variable
aleatoria X a partir de todas las muestras posibles del mismo tamao de una poblacin dada, lo anterior
se denomina distribucin muestral de la media.
La distribucin muestral de la media se puede obtener a partir de la siguiente tabla:
muestra
X1
X2
Total
Promedio
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
1
1
1
3
3
3
3
5
5
5
5
7
7
7
7
1
3
5
7
1
3
5
7
1
3
5
7
1
3
5
7
2
4
6
8
4
6
8
10
6
8
10
12
8
10
12
14
1
2
3
4
2
3
4
5
3
4
5
6
4
5
6
7
x
1
2
3
4
5
6
7
f (x )
1/36
2/36
3/36
4/36
3/36
2/36
1/36
X = E ( X ) = xi f ( xi ) = 1(1/6)+2(2/16)+3(3/16)+4(4/16)+3( 5/16)+2(6/16)+7/16=4
X2 = E ( X 2 ) E ( X ) 2
72
APUNTES DE ESTADISTICA
X2 = E ( X ) 2 E ( X ) 2
1
2
3
4
3
2
1
= xi2 f ( x) X = 12 + 2 2 + 3 2 + 4 2 + 5 2 + 6 2 + 7 2 4 2
16
16
16
16
16
16
16
5
=
2
distribucion muestral
0.25
probabilidad
0.2
0.15
0.1
0.05
3
4
5
promedio de las muestras
Distribucin muestral de
X con n = 2 muestras
Como se puede apreciar en la grfica anterior, la distribucin muestral de la media X tiene una forma
totalmente simtrica. Si el experimento se realiza con una poblacin y muestras ms grandes se
observara el mismo comportamiento, es ms, en el caso lmite de una poblacin y muestras infinitas la
distribucin se transformara en una distribucin normal con media
X .y
varianza
X2,
para ms
X ?, y Cul es la
X =X
X2 =
X2
2
Aunque el problema anterior es un ejemplo de muchos posibles, las relaciones anteriores se cumplen en
el todos los casos de muestreo con reemplazo, esto es,
73
APUNTES DE ESTADISTICA
X =X
2
X
(27)
X2
(28)
EJEMPLOS
24. Supngase que una variable aleatoria X tiene la siguiente distribucin probabilstica
x
a)
X = E ( x) = xi f ( xi ) = 1(1/3)+2(1/3)+3(1/3) = 2
i =1
x1 + x 2
de dos observaciones (n=2) son X ={1 3/2, 2 5/2 3}
2
Explcitamente las muestras son S = {(1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3}
Entonces
f (1) = P ( X = 1) = 1 9
f (3 2) = P( X = 3 2) = 2 9
f (5 2) = P ( X = 5 2) = 2 9
f (3) = P ( X = 3) = 1 9
f (2) = P( X = 2) = 3 9
3/2
5/2
74
APUNTES DE ESTADISTICA
distribucion muestral
0.3
probabilidad
0.25
0.2
0.15
0.1
0.05
0.5
1.5
2
2.5
promedio de las muestras
3.5
c)
n
X = E ( X ) = xi f ( xi ) = 1(1/9)+(3/2)(2/9)+2(3/9)+(5/2)(2/9)+3(1/9) = 2
i =1
X = X = 2
2
X
X2
n
= (2/3)/2=1/3
Y2 =225
Se sabe que
Y2 =
Y =
Y2
n
Y2
n
Y2
n
225
= 15 / 6
36
75
APUNTES DE ESTADISTICA
26. Sea X la duracin en millas de cierta marca de neumticos para automvil. Supnganse que la media
y desviacin tpica de X son, respectivamente, 30 000 y 200 mi. Si se selecciona una muestra aleatoria
de 16 neumticos, cules sern el valor esperado y error tpico de la media muestral?
SOLUCION
Tenemos una variable X, tiene media
muestra es n =16
X =30,000
, desviacin tpica
X =200
y el tamao de la
X = X =30,000 mi
X =
X
n
200 200
=
= 50 mi
4
16
26. Cierta poblacin tiene una media de 36 y una desviacin tpica de 5. Se extrae de esta poblacin una
muestra de 1000 y se calcula la media de la muestra.
a. Obtngase el valor esperado de la media muestral.
b. Obtngase el error tpico de la media muestral.
SOLUCION
Tenemos una variable X, tiene media
=1000
X = X =36
X =
X
n
5
= 0.158
1000
76
APUNTES DE ESTADISTICA
f(x) q
f ( x i ) = (0 )(q ) + (1 )( p ) = p
= p
entonces
= E ( X 2 ) 2 = p p 2 = p (1 p ) = pq
por lo tanto
pq
DISTRIBUCION BINOMIAL
El experimento binomial consiste en n ensayos independientes de Bernoulli. Para cada ensayo
probabilidad de xitos P(E)=p y por lo tanto de fracaso es P(F)=q = 1-p.
La variable aleatoria del experimento es X = {el nmero de xitos en n ensayos}
la
n-k
..
77
APUNTES DE ESTADISTICA
N (k
EXITOS ) =
n!
(n k )! k !
La probabilidad del evento individual mostrado se obtiene aplicando la condicin de que cada ensayo de
Bernoulli es independiente y por lo tanto su probabilidad es el producto de las probabilidades individuales
P( X = k ) =
n!
p k q nk
k!(n k )!
n
f (k ) = p k q n k .
k
(4.1)
k =0
k p
q nk = 1
78
APUNTES DE ESTADISTICA
X = X1+ X2 + X3 + + Xn
Entonces para la media
= E( X 1 + X 2 + K + X n ) = E( X 1 ) + E( X 2 ) + K + E( X n )
= p + p + K + p = np
Por lo que
= np
(4.2)
= n pq
(4.3)
Los coeficientes binomiales dados por la ecuacin (4.1) se pueden calcular mediante el uso de una
calculadora o recurrir a las tablas donde se encuentran previamente evaluados.
Para el caso particular de n = 10 y p =0.5 se tienen la siguiente distribucin de probabilidad
x
f(x)
0
0.00098
1
0.00977
2
0.04395
3
0.11719
4
0.20508
5
0.24609
6
0.20508
7
0.11719
8
0.04395
9
0.00977
10
0.00098
Probabilidad
0.2
0.15
0.1
0.05
10
79
APUNTES DE ESTADISTICA
0
0.10737
1
0.26843
2
0.30198
3
0.20133
4
0.0880
5
0.02642
6
0.00550
7
0.00079
8
0.00007
9
0.0000
10
0.0000
Probabilidad
0.25
0.2
0.15
0.1
0.05
10
3!
= (0.4)1(0.6)2=0.2492
1!(3 1)!
5!
C 25 (0.6) 2 (0.4) 3 =
= (0.6)2(0.4)2=0.2304
2!(5 2)!
a.
C (0.5) (0.5)
x =0
2
b.
3 x
C (0.5) (0.5)
x =0
c.
3
x
5
x
P( X 2 | n = 5
5 x
p = 0.5)
SOLUCION
80
APUNTES DE ESTADISTICA
3. Supngase que en una prueba se incluyen diez preguntas de opcin mltiple, con cinco respuestas
para cada pregunta, de las cuales una es correcta. Si una estudiante responde las preguntas
simplemente adivinando, cul es la probabilidad de que
a. conteste correctamente cinco preguntas;
b. conteste correctamente tres o menos preguntas;
c. conteste correctamente cinco o ms preguntas?
SOLUCION
Puesto que son diez preguntas n = 10 y debido a que se contesta al azar y cada pregunta contiene
cinco posibles respuestas de las cuales solo una es correcta la probabilidad de XITO es p =1/5 = 0.2 y
por lo tanto la de FRACASO q =1-1/5=4/5 = 0.8
Para obtener la evaluacin de cada una de las precuentas se puede recurrir a las tablas
correspondientes de la distribucin binomial
10
a)
b)
C
x =0
10
x
c)
C
x =0
5
x
(0.2) x (0.8)10 x =
=1-0.96721=0.03279
81
APUNTES DE ESTADISTICA
4. Supngase que diez aparatos de radar estn operando independientemente uno del otro, y que la
probabilidad de que uno solo de los aparatos detecte un cohete enemigo es de 0.80. Cul es la
probabilidad de que nueve aparatos de radar detecten el cohete?
SOLUCION
De los datos proporcionados por el problema n =10 y l probabilidad de XITO es p = 0.8 y la de
FRACASO q =1-p =1 - 0.80= 0.20
La pregunta se refiere a que nueve de los aparatos exactamente tengan xito en detectar el cohete
enemigo esto es k = 9, entonces
10
P (3 k, n = 15, p = 0.8) =
C
k =3
15
x
(0.9) k (0.2) n k
Puesto que las tablas de distribucin binomial acumulada dan la sumatoria empiezan en cero, se puede
transformar la expresin anterior al complemento
82
APUNTES DE ESTADISTICA
C
k =0
15
x
(0.9) k (0.2) n k
=1-0.81594=0.18406
6. De la clase del ltimo semestre, 60% son muchachas. Cul es la probabilidad de que en un grupo de
10 estudiantes seleccionados aleatriamente de esta clase haya
a. cinco muchachas;
b. al menos 5 muchachas;
c. cuando ms 5 muchachas;
d. entre 4 y 6 muchachas, inclusive?
SOLUCION
La clase corresponde a n =10 estudiantes con
muchachos q =1-p =1 - 0.60= 0.40
a)
b)
c)
d)
83
APUNTES DE ESTADISTICA
7. Supngase que la probabilidad de que al tirar un dado quede hacia arriba un nmero non de puntos
es 0.4: Cul es la probabilidad de que en cinco tiradas del dado el nmero de veces que aparezca un
nmero non de puntos sea
a. menos de dos;
b. ms de dos;
c. entre dos y cuatro, inclusive?
SOLUCION
El nmero de tiradas es n = 5 y la probabilidad de que quede un nmero non es p =0.4, entonces la
probabilidad de que quede un nmero par es q =1 p =1 .0.4 =0.6
a)
b)
c)
=np =100(0.5)=50
2= npq = 100(0.5)(1-0.5)=25
= 25 =5
84
APUNTES DE ESTADISTICA
9. De acuerdo con los registros de produccin de cierta compaa, el 10% de tornillos producidos por
cierta mquina son defectuosos. Obtnganse la media y la desviacin tpica para X si sta es el nmero
de tornillos defectuosos en cualquier muestra aleatoria de tamao 100.
SOLUCION
Como la variable aleatoria es el nmero de tornillos defectuosos en la muestra n = 100, la probabilidad
xito en este caso es p = 0.1
Aplicando directamente las ecuaciones (30) y (31)
=np =100(0.1)=10
2= npq = 100(0.1)(1-0.1)=9
= 9 =3
DISTRIBUCIN CONTINA DE PROBABILIDAD
DISTRIBUCIN NORMAL
Es una distribucin continua descrita por la siguiente funcin de probabilidad
1 x
1
p( X = x) =
e 2
2
Se aplica a MEDICIONES de cantidades fsicas continuas como longitud, masa, tiempo, voltaje
corriente, energa, temperatura, etc.
1
N ( , ) =
e 2
2
(4.4)
= 2.
85
APUNTES DE ESTADISTICA
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-6
-4
-2
= 1 = 2 , = 0
=2
Por otra parte la variacin del parmetro hace que la altura y la anchura de la distribucin de
probabilidad cambien, esto es, si es grande la distribucin ser ms ancha (ms dispersa) y su altura
disminuir, pero si es pequea su anchura disminuir (ms concentrada) y su altura ser ms grande.
La siguiente figura muestra el efecto de modificar la desviacin tpica para una media dada
tres diferentes desviaciones
= 1, = 4
= 0,
1
.
2
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
-20
-15
-10
-5
10
15
20
= 0 , = 1, = 4
= 12
86
APUNTES DE ESTADISTICA
1
p ( a < X < b) =
e 2
a 2
dy
(4.5)
La figura siguiente muestra la grfica del rea bajo la distribucin normal en un intervalo (a, b )
0.5
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-4
-3
-2
-1
1
2
1
x2
2
(4.6)
x2
1
2
(
0
,
1
)
N
dx
=
e
dx
a
2 a
(4.7)
87
APUNTES DE ESTADISTICA
Z=
(4.8)
-3
-2
-1
p(Z<2.00)=0.9772
p(Z<1.45)=0.9265
Para los incisos c) y d) se procede como se indica a continuacin. El rea para valores de Z mayores
que un nmero negativo es equivalente al rea por debajo del valor absoluto de Z, en la cual se utiliza la
simetra de la distribucin normal. Lo anterior es mostrado en la figura siguiente.
88
APUNTES DE ESTADISTICA
0.5
0.5
0.45
0.45
0.4
0.4
0.35
0.35
0.3
0.3
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0
-4
c)
d)
-3
-2
Z=-1.76
-1
0
-4
-3
-2
-1
Z=1.76
p(Z>-1.76) = p(Z<1.76)=0.9608
p(Z>-1.65) = p(Z<1.65)=0.9505
En el inciso e) la probabilidad solicitada es igual al rea entre los valores Z1=1.00 y Z2=1.89, que de
acuerdo a la figura y a la tabla se puede obtener mediante la diferencia de reas
0.5
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-4
e)
f)
-3
-2
-1
-3
-2
-1
Se puede descomponer en la suma de dos reas, el rea comprendida de-1.40 a 0 mas el rea de 0 a
1.75. Para calcular la primera rea se utiliza la simetra de la distribucin normal esto es
89
APUNTES DE ESTADISTICA
P(-2.15 < Z < -0.55) = P(0.55< Z <2.15) = P(Z <2.15) - P(Z < 0.55)
= 0.9842 - 0.7088 = 0.2754
0.5
0.5
0.45
0.45
0.4
0.4
0.35
0.35
0.3
0.3
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0
-4
0.05
-3
-2
-1
0
-4
-3
-2
-1
11. Obtngase el valor de Z para cada una de las siguientes reas bajo la curva normal estndar.
a)
A la izquierda de Z el rea es 0.9949
b)
A la izquierda de Z el rea es de 0.9951
c)
A la derecha de Z el rea es de 0.005.
d)
A la izquierda de Z el rea es de 0.9412.
e)
A la izquierda de Z el rea es de 0.0582.
f)
A la derecha de Z el rea es de 0.2810.
g)
A la derecha de z el rea es de 0.0228.
SOLUCION
a) Se busca en la tabla el valor del rea respectiva a = 0.9949 que corresponde a Z = 2.57.
b) procediendo de igual que el inciso anterior para a = 0.9951 Z = 2.58.
c) Se requiere el valor de rea a la izquierda, por complemento este valor es a = 1-0.005=0.9950
En la tabla no existen el valor exacto de Z que conduzca al rea = 0.9950, los valores ms aproximados
de Z son Z1 = 2.57 que conduce a a1= 0.9949 y Z2 = 2.58 que a2 = 0.9951, entonces el valor de Z
buscado se encuentra entre estos dos valores de Z ya que el rea solicitada se encuentra entre las dos
reas a = 0.9950.
90
APUNTES DE ESTADISTICA
Como los valores son muy cercanos se puede aproximar el resultado pensando que la relacin es lineal,
esto es
y y1 =
y 2 y1
( x x1 )
x 2 x1
donde x1=a1 = rea 1 correspondiente a y1= Z1 y x2= a2= rea 2 correspondiente a y2= Z2, entonces
Z Z1
(a a1 )
Z Z 1 = 2
a 2 a1
Despejando a y y sustituyendo a x =a
Z Z1
2.58 2.57
(a a1 ) + Z 1 =
Z = 2
(0.9950 0.9949 ) + 2.57 = 2.575
0.9951 0.9949
a 2 a1
d) Buscando en la tabla los valores ms cercanos a el rea a = 0.9412 son Z1 = 1.56 con a1= 0.9406 y
Z2 = 1.57 con a2 = 0.9418. Utilizando el resultado anterior
Z Z1
1.57 1.56
(a a1 ) + Z 1 =
Z = 2
(0.9412 0.9406 ) + 1.56 = 1.565
0.9418 0.9406
a 2 a1
e) Los valores de reas menores que 0.5 en la tabla corresponden a valores negativos de Z, el problema
se pude cambiar por el valor positivo pero para el rea =1- 0.0582 =0.9418 que buscando en la tabla
corresponde a Z = 1.57, por lo tanto el resultado es Z = -1.57.
f) Aplicando el complemento a = 1-0.2810 = 0.7190, buscando en las tablas el valor correspondiente es
Z = 0.58
g) Aplicando el complemento a = 1-0.0228= 0.9772, buscando en las tablas el valor correspondiente es
Z = 2.00
12. Una variable aleatoria (X) se distribuye normalmente, con una media de 100 y una desviacin tpica
de 15. Obtngase la probabilidad de que
a. X sea menor de 80.5; b. X sea mayor de 116.5;
c. X sea menor de 112; d. X est entre 91 y 109;
e. X est entre 85 y 97.
SOLUCION
Para el problema = 100 y =15
a)
b)
c)
80.5 100
=P(Z< -1.30) = 1- P(Z<1.30) = 1- 0.9032 = 0.0968
15
116.5 100
p(X>116.5) = P Z >
= P(Z> 1.1) =1 - P(Z< 1.1) = 1-0.8643= 0.1357
15
112
100
p(X<112) = P Z <
= P(Z< 0.8) = 0.7881
15
p(X<80.5) = P Z
<
91
APUNTES DE ESTADISTICA
d)
109 100
91 100
<Z<
= P(-0.6<Z< 0.6)
15
15
p(91<X<109) = P
= 2* (0.7257)-1 = 0.4515
e)
97 100
85 100
<Z<
= P(-1<Z<-0.2)
15
15
p(85<X<97) = P
Z=
a)
b)
c)
66 70
P Z >
=P(Z>-0.8)= P(Z<0.8)=0.7881
5
63 70
P(X>63)= P Z >
= P(Z>-1.4)= P(Z<1.4)=0.9192
5
75 70
71 70
<Z<
P(71< X <75)= P
= P(0.2< Z <1)= P(Z<1) - P(Z<0.2)
5
5
P(X>66)=
P(X>79)+P(X<61)= P Z >
79 70
61 70
+ P Z <
= P(Z>1.8) + P(Z<-1.8)
5
5
92
APUNTES DE ESTADISTICA
P(X<120)=P(Z<(120-110)/10 =P(Z<1)=0.8413
b) Si el estudiante debe resolver el examen en 125 o ms
P(125X = P(Z<(125-110)/10 =P (1.5 < Z) =1- P(Z<1.5)=1 - 0.9332=0.0668
c) Primero se debe determinar la probabilidad de que los alumnos terminen antes de 110 min.
P(X 110)=P(X< (110-110)/10 =P (X 0) = 0.5
Entonces el nmero de alumnos que terminen antes de 110 min es n = N. P(X 110) =(50)(0.5)=25
15. Supngase que la longitud promedio de la estancia de los pacientes en cierto hospital es de diez
das y la desviacin tpica es de dos das. Considrese que tales duraciones se distribuyen
normalmente.
a. Cul es la probabilidad de que el siguiente paciente que se reciba permanezca ms de nueve das?
b. Si el da de hoy se admitieron 200 pacientes, cuntos continuarn en el hospital dentro de dos
semanas?
SOLUCION
La media y la desviacin tpica son =10, =2
a)
b)
Z Z1
0.68 0.67
(a a1 ) + Z 1 =
Z = 2
(0.7500 0.7486 ) + 0.67 = 0.6745
a
a
0
.
7517
0
.
7486
1
2
X = X =
y desviacin tpica
X =
93
APUNTES DE ESTADISTICA
Z=
X
n
(4.9)
EJEMPLOS
17. Supngase que la distribucin de las edades de los empleados de una gran compaa tiene una
meda de 35 aos y una desviacin tpica de 6 aos. Se considera que la distribucin no es normal. Si se
selecciona una muestra aleatoria de 36 empleados, y se calcula su edad promedio, cul es la
probabilidad de que la edad promedio de la muestra sea
a. de ms de 37.5 aos;
b. de menos de 33 aos;
c. de entre 34.25 y 34.75 aos;
d. de entre 36 y 37.75 aos?
SOLUCION
La media y desviacin tpica de la poblacin es =35, =6 y el tamao de la muestra n = 36
37.5 35
33 35
b) P( x <33)= P
6 36 < Z = P( Z <-2) =1-P(Z<2)=1-0.9772 = 0.0228
a) P(37.5< x )= P
c) P (34.25<
34.25 35
34.75 35
= P(-0.75<Z <-0.25)
x < 34.75) = P
<Z<
6
36
6
36
36 35
37.75 35
= P(1< Z < 2.75)
<
Z
<
6 36
6
36
0
1/10
1
1/10
2
1/10
3
1/10
4
1/10
5
1/10
6
1/10
7
1/10
8
1/10
9
1/10
= E ( x) = xi f ( xi ) =0(1/10)+1(1/10)+2(1/10)+3(1/10)+4(1/10)+5(1/10) + 6(1/10)+7(1/10)+8(1/10) +
9(1/10)+ = 4.5
94
APUNTES DE ESTADISTICA
4.84 4.5
= P(Z< 1.19) = 0.8830
2.87 100
4.79 4.5
a) P( x <4.84)= P Z <
c) P (4.18<
4.18 - 4.5
4.87 - 4.5
= P(-1.11<Z <1.29)
<Z<
x < 4.57) = P
2.87
100
2.87
100
4.00 - 4.5
4.90 - 4.5
= P(-1.74<Z <1.39)
<
Z
<
2.87 100
2.87 100
= P(Z<1.74)+P(Z<1.39)-1 = 0.9591+0.9177-1=0.8768
19. Supngase que a fin de mes los saldos de las cuentas de cheques en bancos se distribuyen
normalmente con media $250 y desviacin tpica $15.
a. Cul es la probabilidad de que una cuenta seleccionada aleatriamente tenga un saldo de ms de
$272.50?
b. Cul es la probabilidad de que el promedio de una muestra aleatoria de 25 cuentas sea de ms de
$257.50?
SOLUCION
De el problema se obtiene que =250, = 15 y n = 25
a)
b)
272.5 250
257.5 250
=P(2.5< Z)=1-P(Z 2.5)=1-0.9938=0.0062
P(257.5< x )= P Z <
15 25
P(272.5< x)= P
95
APUNTES DE ESTADISTICA
=np
(4.10)
= npq
(4.11)
La aproximacin se puede llevar a cabo para un numero n menor siempre y cuando el producto de
np
para este caso. La figura siguiente muestra la distribucin binomial y la normal para n = 15 y p = 0.4.
probabilidad
0.2
0.15
0.1
0.05
6
8
10
numero de exitos
12
14
16
96
APUNTES DE ESTADISTICA
Si ahora n = 15 y p = 0.3 se tiene que n p = 4.5 y n (1 p ) = 10.5, entonces, para este caso no es
adecuado aproximar la distribucin binomial mediante la distribucin normal La figura siguiente muestra
la distribucin binomial y la normal para n = 15 y p = 0.3.
0.25
probabilidad
0.2
0.15
0.1
0.05
6
8
10
numero de exitos
12
14
16
Figura. La aproximacin de la binomial mediante la distribucin normal no es aconsejable para este caso
n =15 y p =0.3
Como se puede deducir de los dos caso anteriores si la probabilidad de xito se aleja de 0.5 entonces
para obtener una buena aproximacin normal se requerir un n mucho mayor, por ejemplo, para n = 30
y p = 0.3 se tiene que n p = 9 y n (1 p ) = 21, y entonces si es posible aproximar la distribucin
binomial mediante la normal. La siguiente figura muestra la aproximacin para n = 30 y p =0.3
0.18
0.16
0.14
probabilidad
0.12
0.1
0.08
0.06
0.04
0.02
0
10
15
20
numero de exitos
25
30
97
APUNTES DE ESTADISTICA
EJEMPLOS
20. Supngase que cierta medicina tiene un 80% de efectividad para curar cierto tipo de enfermedad. Es
decir, en promedio de cada 100 pacientes que contraen la enfermedad y reciben la medicina, se espera
que 80 se recuperen. Sea X el nmero de pacientes en una muestra aleatoria de 100 que se recuperan
despus del tratamiento. Obtnganse las siguientes probabilidades mediante la aproximacin normal.
a. ms de 80 se recuperarn o P(X =80);
b. P(80 < X < 90);
c. P(70 < X < 75).
SOLUCION
La probabilidad de xito es p = 0.8 y el tamao de la muestra es n = 100
La media y la desviacin tpica son
= n p = (0.8)(100)=80
= npq = 100(0.8)(1 0.8) = 4
Entonces
a) P(X>80)=P(Z > (80-80)/4=P(Z >0)=1-P(Z <0)=1-0.5=0.5
b) P(80< X <90)=P((80-80)/4 < Z< (90-80)/4)=P(0< Z < 2.5) = P(Z < 2.5)- P(Z0)
=0.9938-0.5=0.4938
c) P(70< X < 75)=P((70-80)/4 < Z < (75-80)/4)=P(2.5< Z < -1.25)=P(1.25 < Z< 2.5)
= P(Z<2.5)- P(Z<1.25)=0.9938-0.8944=0.0994
21. Se tira diez veces una moneda balanceada. Obtngase la probabilidad de que ocurran ya sea el
seis, siete u ocho caras mediante
a. la distribucin binomial;
b. el mtodo de la aproximacin normal con correccin por continuidad.
SOLUCION
a) Puesto que la moneda es balanceada p = 0.5 y n = 10, aplicando la distribucin binomial
10
10
10
(0.5) 6 (0.5) 4 + (0.5) 7 (0.5) 3 + (0.5) 8 (0.5) 2
0
7
8
P(6 X 8)=
=0.205078+0.11718+0.043945=0.366203
b) Aplicando la distribucin binomial y la correccin por continuidad
= n p = 10(0.5) = 5
= npq = 10(0.5)(0.5) = 2.5 = 1.5811
P(6 X 8)=P((5.5 X 8.5)=P((5.5-5)/1.5811 Z (8.5-5)/1.5811)
=P(0.3162 Z 2.2136)= P(Z < 2.21)-P(Z 0.32) =0.9864 - 0.6255 = 0.3609
98
APUNTES DE ESTADISTICA
Probabilidad
0.25
0.2
0.15
0.1
0.05
4
6
Nmero de xitos
10
99
APUNTES DE ESTADISTICA
100
APUNTES DE ESTADISTICA
0.5
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-4
-3
-2
-1
Figura. Esquema utilizando la distribucin normal para mostrar la prueba de dos colas, la regin sombreada
representa la regin de rechazo de la hiptesis nula Ho
-3
-2
-1
Figura. Esquema utilizando la distribucin normal para mostrar la prueba de cola derecha, la regin sombreada
representa la regin de rechazo de la hiptesis nula Ho
101
APUNTES DE ESTADISTICA
0.5
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-4
-3
-2
-1
Figura. Esquema utilizando la distribucin normal para mostrar la prueba de cola izquierda, la regin
sombreada representa la regin de rechazo de la hiptesis nula Ho
I
II
PROBABILIDAD
La relacin entre los tipos de error y se muestra en la siguiente grfica para la .Ho:= 0 y H1: >0
102
APUNTES DE ESTADISTICA
= 0
> 0
Figura. Relacin entre los errores tipo I representado por el rea sombreada y el error
representado por el rea sombreada
tipo II
Los valores del estadstico de prueba se dividen en 2 categoras: regin de rechazo y regin de
aceptacin, tambin se conoce la regin de rechazo como regin crtica.
TOMA DE LA DECISIN:
El valor que separa las dos regiones es llamado el valor crtico. Se toma la decisin dependiendo
en que regin cae el valor del estadstico de prueba. Si el valor del estadstico de prueba cae el la regin
de rechazo, la hiptesis nula se rechaza, en caso contrario se acepta.
TABLA DE DECISIONES
Decisin
Se rechaza H0
No se rechaza H0
H0 es verdadera
H0 es falsa
Error tipo I
Decisin correcta
1-
Decisin correcta
1-
Error tipo II
103
APUNTES DE ESTADISTICA
Las siguientes figuras muestran el valor crtico, las regiones de aceptacin y rechazo, para el caso de
que se utilice a Z como estadstico de prueba, para cada una de los tres tipos de prueba de hiptesis.
Prueba de dos colas
0.5
0.45
0.4
0.35
H1: 0
0.3
0.25
0.2
0.15
0.1
1-
0.05
0
-4
/2
-3
-2
-1
/22
Regin de aceptacin
Regin de rechazo
Regin de rechazo
Valor crtico
Valor crtico
Z/2
Z/2
Prueba de cola derecha
0.5
0.45
0.4
H1: > 0
0.35
0.3
0.25
0.2
0.15
0.1
1-
0.05
0
-4
-3
-2
-1
Regin de aceptacin
Regin de rechazo
Valor crtico
Z
H1: < 0
0.35
0.3
0.25
0.2
0.15
1-
0.1
0.05
0
-4
-3
-2
-1
Regin de rechazo
Valor crtico
Z
Regin de aceptacin
104
APUNTES DE ESTADISTICA
EJEMPLOS
1. En la prueba de la hiptesis nula = 100, la hiptesis alternativa puede ser cualquiera de las
siguientes.
a. =110
b. = 90
c. > 100
d. < 100
e. 100
Cules de estas cinco pruebas son de una cola? Cules son de dos colas?
SOLUCION
a) Como =110 y se encuentra a la derecha, es una prueba de cola derecha.
b) En este caso = 90 es menor a 100, por lo que es una prueba de cola izquierda.
c) > 100 es una prueba de cola derecha.
d) < 100 es una prueba de cola izquierda.
e) 10 representa a una prueba de dos colas.
2. Supngase que la produccin promedio por hora de los trabajadores de cierta fbrica es de 60
unidades. El director de personal de la fbrica afirma que el programa de entrenamiento implantado
hace algn tiempo ha aumentarlo la productividad de los trabajadores. Plantense las hiptesis nula y
alternativa.
SOLUCION
La Hiptesis nula en general se relaciona con que el estimador no cambia, por lo tanto H0: =60 y como
se seala que el programa de entrenamiento ha mejorado la productividad la hiptesis alternativa se
propone de cola derecha, esto es H1: >60
3. Cierto proceso de produccin est diseado para dar como resultado tornillos con una longitud
media de 3 plg. Plantese la regla de decisin para cada una de las siguientes situaciones:
a. El gerente de produccin desea determinar si la longitud promedio ha disminuido.
b. Desea determinar si la longitud promedio ha aumentado.
c. Desea determinar si la longitud promedio ha cambiado.
SOLUCION
Para el problema se debe seleccionar 0= 3 pulgadas y de acuerdo a cada uno de los incisos
a) H0: =3
b) H0: =3
c) H0: =3
H1: < 3
H1: > 3
H1: 3
Ha disminuido
Ha aumentado
Ha cambiado
4. Supngase que el gasto anual en libros por parte de los estudiantes universitarios de los EUA se
distribuye normalmente con media de $ 200. Formlese, para cada una de las siguientes pruebas, la
hiptesis alternativa y plantese la regla de decisin.
a. Prubese si los estudiantes en la universidad a la que usted asiste han gastado ms que el promedio
nacional.
b. Prubese si el gasto anual por parte de los estudiantes de la universidad a la que usted asiste es
diferente del promedio nacional.
105
APUNTES DE ESTADISTICA
SOLUCION
En este caso se elige 0= 200 y la hiptesis nula es para ambos inciso H0: =200.
a) La hiptesis alternativa es H1: <200, y se rechaza H0 para algn valor de X lo suficientemente
grande.
b) La hiptesis alternativa es H1: 200 y se rechaza H0 si X lo suficientemente grande o
suficientemente pequeo.
HIPOTESIS INEXACTA
Las hiptesis se pueden clasificar como exactas e inexactas. Una hiptesis es exacta si se especifica
en la prueba un nico valor, por ejemplo, H0 : = o, mientras que si especifica un conjunto de valores
como H0 : o H0 : > o ser una hiptesis inexacta. Las siguientes figuras muestran los casos de
la Hiptesis exacta e inexacta de manera grfica.
0.1
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
70
75
80
85
90
95
100
105
110
115
120
H0 : o
Figura. Sucesin de grficas con media menor a 100 que muestran el caso H0 : o
0.1
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
80
85
90
95
100
105
110
115
120
125
130
H0 : > o
Figura. Sucesin de grficas con media mayor a 100 que muestran el caso H0 : > o
El rea sombreada para cada una de las grficas de las dos figuras anteriores es cada vez ms pequea
conforme la media se vuelve ms pequea ( ms grande), lo anterior implica que si se rechaza la
hiptesis exacta = o con probabilidad entonces para todos los casos o ( > o) se rechazara
la hiptesis nula con una probabilidad menor a . Por lo que los casos de hiptesis inexactas se
trabajarn como hiptesis exactas = o con probabilidad de rechazo .
106
APUNTES DE ESTADISTICA
X =
X =
Z=
Z=
X X
(5.1)
(5.2)
EJEMPLOS
5. Se supone que los C.I. de los alumnos de cierto grupo tnico est en promedio ocho puntos por
encima que el promedio de todos los alumnos en el pas. Se sabe que para todos los alumnos la media
es 100 y la desviacin tpica es 15. Pruebas aplicadas a una muestra de 25 alumnos seleccionados
aleatriamente entre el grupo tnico en cuestin proporcionan un C.I. medio de 104. Considerando que
los C.I. Tienen una distribucin normal, prubese la hiptesis H0 : = 100 en contra de la hiptesis
alternativa H1: = 108 en = 0.05. Determnese tambin el valor de .
SOLUCION
Los datos del problema son
La media y desviacin estndar son =100, =15, el nivel de significacin es =0.05, el tamao de la
muestra es n = 25 y la media muestral es X = 104
Las Hiptesis correspondientes nula y alternativa son respectivamente
H0: =100
H1: 1=108
La prueba es de una cola derecha. A partir del nivel de significancia =0.05, se determina el rea a la
izquierda como A =1-0.05 =.95, entonces el valor crtico Z se obtiene de la puntuacin cuya rea bajo la
curva normal es igual a 0.95 este valor corresponde a Z = 1.645
Calculando el estadstico de prueba correspondiente a partir de la tipificacin de la media muestral x
107
APUNTES DE ESTADISTICA
Z=
104 100
= 4/3=1.333
15
25
0.5
0.45
0.4
H1: > 0
0.35
0.3
0.25
1-
0.2
0.15
0.1
Z=1.333
0.05
0
-4
-3
-2
-1
Regin de aceptacin
Regin de rechazo
Z=1.645
b) Para determinar el error tipo II , se requiere determinar primero x la cual se puede obtener
despejando de la relacin Z =
X
n
( )
25
n
= 100
X =104.9
=108
108
APUNTES DE ESTADISTICA
104.9 108
= P(Z < -1.02166)=1-0.8461=0.1539
3
6. Una compaa que procesa fibras naturales afirma que sus fibras tienen una resistencia media a la
ruptura de 40 lb y una desviacin tpica de 8 lb. Un comprador sospecha que la resistencia media a la
ruptura es de solamente 37 lb, Una muestra aleatoria de 64 fibras proporciona una media de 38 lb.
Deber rechazar el comprador H0: =40 en favor de H1: = 37 si el nivel de significacin es 0.01?
SOLUCION
Los datos del problema son
Los parmetros poblacionales son =40, =8 promedio probables 1=37, tamao de la muestra n = 64
nivel de significacin =0.01, media muestral x = 38
Las Hiptesis correspondientes nula y alternativa son respectivamente
H0: =40
H1: 1=37
La prueba es de una cola izquierda, entonces, el rea a la izquierda de la distribucin debe ser
A =1- = 1 - 0.01=0.99 lo cual corresponde a Z= - 2.3226
El valor del estadstico de prueba es Z =
38 40
= 2
8
64
1-
Z=-2
0.15
0.1
0.05
0
-4
-3
-2
Regin de rechazo
Z=-2.3226
-1
Regin de aceptacin
109
APUNTES DE ESTADISTICA
7. Un fabricante de medias est considerando reemplazar una vieja mquina de coser por una nueva. La
vieja mquina produce cuando ms, un promedio de 300 pares de medias por hora, con una desviacin
tpica de 30 pares. Se considera que la produccin por hora de tales mquinas de coser tiene una
distribucin normal. El vendedor de la nueva mquina afirma que su produccin promedio por hora es de
ms de 300 pares. La nueva mquina se prueba durante un periodo de 25 h y se determina su
produccin promedio por hora como 310 pares. si el nivel de significacin es de 0.05, debera
rechazarse la hiptesis nula = 300?
SOLUCION
Los datos proporcionados por el problema son
Media =300, desviacin =30, tamao de la muestra n = 25, nivel de significancia =0.05, media
muestral X 310
La prueba de hiptesis se puede plantear como:
H0: =300
H1: >300
Corresponde a una prueba de una cola derecha
Utilizando la el nivel de significacin =0.05, se determina el rea a la izquierda de la distribucin
normal A =1- =1-0.05=0.95, el cual corresponde a una valor de puntuacin crtico Z=1.645
El valor del estadstico de prueba Z es
Z=
310 300
= 1.6666
30
25
0.5
0.45
0.4
0.35
0.3
Z=1.6666
0.25
1-
0.2
0.15
0.1
0.05
0
-4
-3
-2
-1
Regin de aceptacin
Z=1.645
Regin de rechazo
110
APUNTES DE ESTADISTICA
8. Una compaa de servicio pblico desea determinar si su nuevo horario de Trabajo ha reducido de
manera importante el tiempo de espera de los clientes para servicio. El tiempo de espera fue de al
menos 30 min en el pasado y se sabia que la desviacin tpica era de 12 min. Se selecciona
aleatriamente una muestra de 144 observaciones. Se obtiene una media de 28 min. Debera
rechazarse la hiptesis nula 30 en favor de la hiptesis alternativa < 30 para = 0.05?
SOLUCION
Los datos proporcionados por el problema son
Media =30 min, desviacin =12 min, tamao de la muestra n = 144, nivel de significancia =0.05,
media muestral x = 28 min
La prueba de hiptesis nula es inexacta se puede plantear como:
H0: 30
H1: <30
Corresponde a una prueba de una cola izquierda
Utilizando la el nivel de significacin =0.05, se determina el rea a la izquierda de la distribucin
normal A =1- =1-0.05=0.95, el cual corresponde a una valor de puntuacin crtico Z= -1.645
El valor del estadstico de prueba Z es
Z=
28 30
= -2.000
12
144
0.5
0.45
0.4
0.35
0.3
0.25
0.2
0.15
1-
Z=-2
0.1
0.05
0
-4
-3
-2
Regin de rechazo
Z=-1.645
-1
Regin de aceptacin
111
APUNTES DE ESTADISTICA
9. Los empleados que contraen cierta enfermedad y reciben tratamiento mdico normal para ella
permanecen ausentes del trabajo durante un promedio de 15 das. Un equipo mdico de investigacin
afirma que se ha desarrollado un nuevo tratamiento que reducira el periodo promedio de ausencia del
trabajo. Considrese que el periodo de ausencia del trabajo tiene una distribucin normal y una
desviacin tpica de tres das. Debera rechazarse la hiptesis nula = 15 para = 0.1 si una muestra
de 16 pacientes que han recibido el nuevo tratamiento tiene una ausencia promedio del trabajo de
exactamente 13 das?
SOLUCION
Los datos proporcionados por el problema son =15 das, =3 das, n = 16, X = 13 y =0.1
La prueba de hiptesis corresponde a una prueba de una cola izquierda con A =1- =1-0.1=0.9
correspondiente a Z= -1.282
El valor del estadstico de prueba Z es
Z=
13 15
= -2.666
3
16
0.04
0.035
0.03
0.025
0.02
0.015
0.01
0.005
0
60
80
100
1 = 100
120
140
160
2 = 120
Figura. Representacin de dos poblaciones con desviacin tpica =10 y medias 1 = 100 y 2 = 120
112
APUNTES DE ESTADISTICA
D = X1 X 2
Donde X 1
(5.3)
y desviacin tpica
y X2
procede otra poblacin con media 2 y desviacin tpica 2 . Los parmetros para variable aleatoria D
se puede determinar aplicando las propiedades del valor esperado y varianza para muestras
independientes
= E ( D ) = E ( X 1 X 2 ) = E ( X 1 ) + E ( X 2 ) = 1 2
(5.4)
y la varianza
12
n1
22
n2
(5.5)
D =
21
n1
22
n2
(5.6)
D es normal.
La prueba de hiptesis acerca de la diferencia de medias se puede llevar acabo bajo dos condiciones
diferentes:
1) Cuando se conoce las varianzas poblacionales 1 y 2
2) Cuando no se conocen las varianzas poblacionales y tienen que estimarse a partir de las varianzas
2
muestrales s1 y s 2 .
Primeramente los problemas que se desarrollan continuacin suponen conocidas las varianzas
poblacionales
12
22 .
1 = 2
1 < 2
1 > 2
1 2
El estadstico de prueba es
Z=
( X 1 X 2 ) ( 1 2 )
D
(5.7)
113
APUNTES DE ESTADISTICA
Z=
(X1 X 2 )
12
n1
22
(5.8)
n2
La prueba se realiza de manera semejante a la realizada anteriormente para la media, solamente que
ahora para la prueba de dos medias se utiliza un estadstico diferente.
EJEMPLOS
10. Se realiz un estudio para determinar si los alumnos pertenecientes a dos grupos tnicos, I y ll,
tienen distintos CI., promedio. Se considera que las varianzas de los CI en los grupos I y ll son
respectivamente,
12 = 225 y 22
= 196. Se toma una muestra de 25 alumnos del grupo l (n1 = 25) y otra
de 28 del grupo II (n2 = 28). En base a la diferencia entre las dos medias muestrales, X 1 = 102 y X 2 =
98. Prubese la hiptesis nula de que los alumnos de los dos grupos tnicos tienen CI promedio
idnticos con respecto a la hiptesis alternativa de que los dos promedios son diferentes en = 0.05.
SOLUCION
La lista de datos proporcionados por el problema se resume a continuacin
12 = 225
22 = 196
X 1 = 102
X 2 = 98
n1=25
n2=28
Z=
X1 X
2
1
n1
2
2
n2
102 98
4
= =1
225 196 4
+
25
28
114
APUNTES DE ESTADISTICA
1-
0.15
Z =1
0.1
/2
0.05
0
-4
-3
/2
-2
-1
Regin de rechazo
Regin de aceptacin
Z/2 =-1.960
Regin de rechazo
Z/2 =1.960
11. Cierta gran compaa emplea tanto hombres como mujeres para realizar el mismo tipo de trabajo.
Se tiene la hiptesis de que la produccin promedio de los hombres es menor que la de las mujeres.
Supngase que el equipo de investigacin de la compaa proporciona la siguiente informacin.
Hombres
Mujeres
n2 = 36
Tamao de la muestra
n1 = 36
X 1 = 150 y X 2 =153
Media muestral en unidades
12 = 70
Varianza
22 =74
Es significativamente menor la produccin promedio por hora de los hombre que la de las mujeres para
= 0.05? (Considrese que las dos muestras son independientes.)
SOLUCION
Las hiptesis nulas y alternativas son
H0: 1 = 2
H1: 1 < 2
De acuerdo al nivel de significacin =0.05,
A = 1- = 1-0.05=0.95 correspondiente al valor crtico Z= -1.645
El estadstico de prueba Z es
Z=
(X1 X 2 )
2
1
n1
2
2
n2
150 153
70 74
+
36 36
3
= 1.5
2
115
APUNTES DE ESTADISTICA
0.5
0.45
0.4
0.35
0.3
0.25
0.2
1-
0.15
0.1
Z=-1.5
0.05
0
-4
-3
-2
-1
Regin de rechazo
Regin de aceptacin
Z=-1.645
12.Un fabricante afirma que el cordn nylon que su compaa produce es ms fuerte que el cordn de
algodn. Dada la siguiente informacin:
Tamao de la muestra
Resistencia promedio a la
ruptura
Varianzas
Cordn de nylon
n1 =36
X 1 =105 lb
12 = 74
Cordn de algodn
n2 = 36
X 2 = 101 lb
22 =70
Podra llegarse a la conclusin de que en realidad el cordn de nylon es ms fuerte que el de algodn
para = 0.01?
SOLUCION
Las hiptesis nulas y alternativas son
H0: 1 = 2
H1: 1 > 2
De acuerdo al nivel de significacin =0.01,
A = 1- = 1-0.01=0.99 correspondiente al valor crtico Z= 2.326
El estadstico de prueba Z es
Z=
(X1 X 2 )
2
1
n1
2
2
n2
105 101 4
= = 2.0
70 74 2
+
36 36
116
APUNTES DE ESTADISTICA
0.5
0.45
0.4
0.35
0.3
0.25
Z=2
0.2
0.15
1-
0.1
0.05
0
-4
-3
-2
-1
Regin de aceptacin
Regin de rechazo
Z=2.326
= np =100(0.9)=90
117
APUNTES DE ESTADISTICA
= npq = (100)(0.9)(0.1) = 3
Para p
= 0.95, el promedio estimado es entonces
X = n p = (0.95) (100) = 95
Las hiptesis nulas y alternativas del problema son
H0: p = 0.9
H1: p > 0.9
o
o
= 90
> 90
Z=
X 95 - 90
=
=1.6666
como Z > Z, se rechaza la hiptesis nula H0 a favor de H1, esto es, la medicina tiene una efectividad
mayor que el 90 %.
14. Un investigador de mercado desea determinar si las amas de casa prefieren el aceite de cocina I o el
aceite de cocina II. Se entrevista a 30 amas de casa y 18 de ellas indican que prefieren el aceite I.
Puede llegarse a la conclusin de que las amas de casa en general prefieren el aceite I, si el nivel de
significacin es de 0.04937?
SOLUCION
Debido a que el tamao de la muestra es pequea n = 30, se debe utilizar preferentemente las tablas de
la distribucin binomial correspondientes.
Como no existe preferencia previa con respecto a la eleccin de los tipos de aceite, se tiene una
proporcin p0 = 0.50, entonces el nmero de xitos esperado para esta proporcin es
= np = (30) (0.5)=15
Las hiptesis nulas y alternativas en competencia son
H0: p = 0.5
H1: p > 0.5
o
o
= 15
> 15
Para el nivel de significancia =0.04937 y considerando la prueba de cola derecha el rea a la izquierda
e la distribucin binomial es A =1- = 1 - 0.04937 =0.95063, buscando el la tabla para la distribucin
binomial acumulada para n =30 y p =0.5 se encuentra que el nmero de xitos crtico correspondiente es
X= 19
118
APUNTES DE ESTADISTICA
De acuerdo a los datos proporcionados la cantidad de xitos preferencias por el aceite I es X =18,
entonces, X < X y no debe rechazarse la hiptesis nula.
BINOMIAL
0.16
0.14
0.12
X =18
1-
0.1
0.08
0.06
0.04
0.02
0
10
Regin de aceptacin
15
20
X=19
25
30
Regin de rechazo
15. Considrese p, la verdadera proporcin de los votantes registrados que estn en contra de la pena
capital. Supngase que en el pasado p ha sido igual a 50% menos. Actualmente existen razones para
creer que p ha aumentado. Una muestra aleatoria de 20 votantes de una proporcin en la muestra del
55 %, Puede llegarse a la conclusin de que la verdadera proporcin permanece sin cambio, es decir
sin haber aumentado, para = 0.0207?
SOLUCION
Por el tamao de la muestra es pequea n = 20, se debe utilizar las tablas de la distribucin binomial
correspondientes.
La proporcin previa en contra de la pena capital es p0 = 0.50 lo cual corresponde a una media
= np = (20)(0.5)=10
Las hiptesis nulas y alternativas en competencia son
H0: p = 0.5
H1: p > 0.5
o
o
= 10
> 10
Para el nivel de significancia =0.0207 y considerando la prueba de cola derecha el rea a la izquierda
e la distribucin binomial es A = 1- = 1 - 0.0207=.9793, buscando el la tabla para la distribucin
binomial l acumulada para n =20 y p =0.5 se encuentra que el nmero de xitos crtico correspondiente
es X= 14
De acuerdo a los datos la nueva proporcin de votantes en contra de la pena capital es p
=0.55 por lo
que el valor esperado correspondiente a la cantidad de xitos es
119
APUNTES DE ESTADISTICA
X = np = (20) (0.55) = 11
Como X < X y no debe rechazarse la hiptesis nula.
BINOMIAL
0.2
0.18
0.16
0.14
0.12
0.1
1-
0.08
0.06
0.04
0.02
0
Regin de aceptacin
10
X =11
12
14
X=14
16
18
20
Regin de rechazo
16. Se ha insinuado que los profesores se han vuelto ms despreocupados al calificar a sus estudiantes.
En el pasado, 80% de todos los estudiantes universitarios de primer ao obtenan C o calificaciones
superiores. Una encuesta de la clase ms reciente de estudiantes universitarios de primer arto muestra
que 8100 de los 10 000 estudiantes universitarios de primer ao de la muestra recibieron calificaciones
de C o mayores. Es verdadero que los profesores se han vuelto ms despreocupados, si el nivel de
significacin se especifica en 0.01?
SOLUCION
La proporcin previa de acuerdo a loa datos es p0 = 0.80
El tamao de la muestra es n = 1000,
Debido al tamao de la muestra se utilizar la aproximacin normal a la binomial.
Utilizando los datos anteriores se tiene que el promedio es
= np =10000(0.80)=8000 estudiantes
y la desviacin tpica de la poblacin es
o
o
= 8000
> 8000
120
APUNTES DE ESTADISTICA
Z=
8100 8000
= 2.5
40
como Z > Z, se rechaza la hiptesis nula H0 a favor de H1, esto es, los profesores se han vuelto ms
despreocupados
0.5
0.45
0.4
0.35
0.3
0.25
0.2
Z=2.5
1-
0.15
0.1
0.05
0
-4
-3
-2
-1
Regin de aceptacin
Regin de rechazo
Z=2.326
ESTIMACION MATEMATICA
El procedimiento para determinar un intervalo de valores entre los cuales se encuentre el de un
parmetro de la poblacin con una probabilidad 1- se conoce como estimacin del intervalo. El
parmetro se interpreta como la probabilidad de cometer un error en la estimacin, por lo que 1- es
la medida de la confianza para la media poblacional, equivalente a la probabilidad de que el
parmetro poblacional estimado se encuentre dentro de intervalo adecuado.
1-
0.2
0.15
/2
0.1
0
-4
/2
0.05
-3
-2
- Z/2
-1
Z/2
121
APUNTES DE ESTADISTICA
Garantizado as que Z se encuentra en el intervalo -Z/2 < Z < Z/2 con una probabilidad 1-. Utilizando
el hecho de que Z =
Z / 2 <
, se tiene que
< Z / 2
Multiplicando por -1
Z / 2 >
X +
Z > Z / 2
Z / 2 <
X +
< Z / 2
Multiplicando por :
Z / 2 X < X < Z / 2 X
Sumando X
X Z / 2 X < < X + Z / 2 X
X =
X Z / 2
(5.9)
< < X + Z / 2
(5.10)
= 1 2
D = 1 2 =
D =
12
n1
22
n2
122
APUNTES DE ESTADISTICA
D Z / 2
12
n1
22
n2
< < D + Z / 2
12
n1
22
n2
(5.11)
np , X np ,
X np (1 p )
donde
p es la proporcin estimada a
Entonces
X Z / 2 X < < X + Z / 2 X
n p Z / 2
np (1 p ) < n p < n p + Z / 2
np (1 p )
Dividiendo entre n:
p Z / 2
np) (1 p )
< p < p + Z / 2
n
Finalmente
p Z / 2
np) (1 p )
n
p) (1 p )
< p < p + Z / 2
n
p) (1 p )
n
(5.12)
EJEMPLOS
17. Supngase que un psiclogo desea realizar una estimacin de intervalo de la media verdadera de los
C.I. de alumno, de cierto grupo tnico. Se sabe que los C.I. se distribuyen normalmente con desviacin
tpica de 15. Constryase un intervalo de confianza del 95% para la media verdadera () con base en
una muestra de 25 alumnos con una media muestral de 105
SOLUCION
Los datos proporcionados por le problema son
Desviacin tpica =15, media muestral
1-=0.95
123
APUNTES DE ESTADISTICA
X Z / 2
105 1.960
< X + Z / 2
n
15
25
105 + 1.960
15
25
99.12< <110.88
18. Una compaa fabricante de harina la empaca en bolsas de papel. Se desea estimar el verdadero
peso medio de las bolsas. Una muestra de 36 bolsas da media muestral de 24.5 lb. La desviacin tpica
es de 15 lb. Obtngase el intervalo de confianza del 99 % para su verdadero peso medio de las bolsas
de harina.
SOLUCION
Los datos proporcionados por le problema son
Desviacin tpica =15, media muestral X = 24.5, tamao de la muestra n = 36 y intervalo de confianza
1-=0.99
A partir del intervalo de confianza =1-0.99=0.01, entonces /2=0.005
El rea a la izquierda de la distribucin normal es A = 1-(/2)=0.995, buscando en la tabla se obtiene
que Z/2=2.575
Sustituyendo en la ecuacin 43
X Z / 2
24.5 2.575
< X + Z / 2
15
15
24.5 + 2.575
36
36
Mtodo 2
n2=36
X 2 =55
12 =200
22 =276
Determnese el intervalo de confianza del 98% para la verdadera diferencia en la efectividad de los dos
mtodos de entrenamiento.
SOLUCION
A partir del intervalo de confianza =1-0.98=0.02, por lo tanto /2=0.01
El rea a la izquierda de la distribucin normal es A = 1-(/2)=0.99, buscando en la tabla se obtiene que
Z/2=2.326
124
APUNTES DE ESTADISTICA
D = X 1 - X 2 = 45 - 55= -10
D =
12
n1
22
n2
200 276
=4
+
24
36
Sustituyendo en la ecuacin 44
D Z / 2
12
n1
22
n2
< < D + Z / 2
12
n1
22
n2
-10-2.326(4)< <-10+2.326(4)
-19.304< <-0.696
20. Se realiza un experimento para estimar la verdadera diferencia en la duracin promedio de dos
marcas de bateras para automviles. Con la siguiente informacin determnese el intervalo de confianza
del 95% para la verdadera diferencia en la duracin de las dos marcas de bateras para automviles.
Marca I
Tamao de la muestra
n1 = 36
Duracin promedio (meses) X 1 = 38
Varianza
12 = 41
Marca II
n2 = 36
X 2 = 35
22 = 40
SOLUCION
El intervalo de confianza es =1-0.95=0.05, por lo tanto /2=0.025
El rea a la izquierda de la distribucin normal es A = 1-(/2)= 1-0.025 = 0.975, buscando en la tabla se
obtiene que Z/2= 1.960
Utilizando los datos proporcionados se calcula
D = X 1 - X 2 = 38 - 35=3
D =
12
n1
22
n2
41 40
= 1.5
+
36 36
Sustituyendo en la ecuacin 44
r
r
12 22
12 22
+
< < D + Z / 2
+
D Z / 2
n1
n2
n1
n2
3-1.960 (1.5)< <3+1.960 (1.5)
0.0.06 < < 5.94
125
APUNTES DE ESTADISTICA
21 Se realiz una investigacin de tele audiencia. En una muestra de 900 espectadores, el nmero de
ellos que vean un programa en particular fue de 180. Determnese el intervalo de confianza del 99%
para la verdadera proporcin de espectadores que ven este programa en particular.
SOLUCION
Tamao de la muestra n = 900, nmero de espectadores que ven el programa X = 180, intervalo de
confianza es 1- = 0.99
Como el tamao de la muestra es grande se utiliza la aproximacin normal a la binomial.
A partir del intervalo de confianza =1- 0.99 =0.01 entonces /2= 0.005 y l rea a la izquierda de la
distribucin normal es A = 1-0.005 = .995, buscando en la tabla correspondiente se obtiene que
Z/2= 2.575
La proporcin estimada por los datos
p =
X
180
=
= 0.2
n
900
p Z / 2
p) (1 p )
< p < p + Z / 2
n
0.2 2.575
p) (1 p )
n
0.2(1 0.2)
0.2(1 0.2)
< p < 0.2 + 2.575
900
900
p =
X
32
=
= 0.5
n
64
126
APUNTES DE ESTADISTICA
p) (1 p )
p) (1 p )
< p < p + Z / 2
n
n
0.5(1 0.5)
0.5(1 0.5)
=
0.5 1.960
< p < 0.5 1.960
64
64
p Z / 2
X
s
n
(5.13)
Se utiliza como estadstico de prueba. Sin embargo si la muestra es pequea se tiene que la desviacin
tpica muestra s es bastante distinta a la poblacional . Por lo anterior no es posible utilizar la
distribucin normal para el caso de muestras pequeas.
La solucin del problema anterior de la inferencia estadstica acerca de un parmetro de la poblacin
utilizando muestras pequeas y desconociendo la varianza poblacional fue resuelto por W. S: Gosset en
1908 al publicar una distribucin de probabilidad la cual describe el comportamiento del estadstico dado
por la ecuacin (5.13), siempre y cuando la muestra sea obtenida a partir de una poblacin con
distribucin de probabilidad normal.
DISTRIBUCION T-STUDENT
La distribucin t-Student se obtiene a partir de considerar que la muestra pequea se obtiene a partir de
una poblacin con distribucin normal, si la hiptesis anterior no se cumple ser necesario utilizar los
mtodos no paramtricos para la prueba de hiptesis.
La distribucin t-student o simplemente distribucin t es al igual que la distribucin normal una
distribucin continua en forma de campana simtrica, cuyo estadstico de prueba es
T=
X
s
n
(5.14)
+ 1
1
2 x
P ( < T < x) =
2
( )
donde
(n ) =
t2
1 +
( +1)
dt
(5.15)
127
APUNTES DE ESTADISTICA
Como se puede observar de la distribucin t-student tiene una expresin matemtica complicada, y al
igual que con la distribucin normal recurriremos a las tablas respectivas para la solucin de los
problemas.
Por otra parte la distribucin t student tiene ms variabilidad que la distribucin normal ya que depende
del nmero de datos n.
Esto es, a diferencia de la distribucin normal en la cual el estadstico Z depende de de y que son
constantes e independientes del tamao de la muestra n, en el estadstico T la desviacin tpica
muestral s depende de el tamao de la muestra n. en consecuencia T es ms variable que Z.
La variabilidad de la distribucin t-student se asocia con el concepto de grados de libertad, es cual es
simplemente se define como
= n 1
(5.16)
As se tiene que para cada grado de libertad se tendra que utilizar una tabla para la distribucin tstudent, pero en general para las pruebas de hiptesis respetivas solo son necesarios los valores
crticos correspondientes a los valores de significacin ms utilizados (10%, 5%, 2.5%, 1%, etc) los
cuales son reportados en una sola tabla.
Por otra parte la distribucin T-student converge o se aproxima a la normal cuando el nmero de datos
tiende a infinito. Las siguientes figuras muestran una distribucin t student para =4 y su comparacin
con la distribucin normal.
T STUDENT
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-5
-4
-3
-2
-1
-4
-3
-2
-1
128
APUNTES DE ESTADISTICA
EJEMPLOS
23. Para una distribucin con 10 grados de libertad, obtngase el valor crtico t que corta cada una de
las siguientes reas bajo la curva.
a. El 2.5% superior
b. El 5% inferior
c. El 0.005 superior
d. El 0.01 inferior
SOLUCION
Recurriendo directamente a la tabla correspondiente de la distribucin t-student
a)
b)
c)
d)
Superior = 0.025
El 5% inferior
El 0.005 superior
El 0.01 inferior
24. Supngase que cierta prueba implica un nivel de significacin de 0.10 y una muestra de 25
observaciones. Obtngase el valor crtico t bajo cada una de las siguientes condiciones y mustrese
grficamente cada respuesta.
a. Una prueba de una cola con la regin de rechazo en el rea de la cola superior.
b. Una prueba de una cola con la regin de rechazo en el rea de la cola inferior.
c. Una prueba de dos colas.
SOLUCION
a) Recurriendo a la tabla de la distribucin t-student para =n-1=25-1=24 y =0.1 se tiene T0.1, 24 = 1.318
T STUDENT
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-5
-4
-3
-2
-1
b) El valor para el caso de cola inferior es igual al anterior pero negativo T 24, 0.1= - 1.318
T STUDENT
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-5
-4
-3
-2
-1
129
APUNTES DE ESTADISTICA
c) En el caso de dos colas se tiene que /2 = 0.1/2=0.05 lo cual corresponde a T0.1, 24 = 1.711
T STUDENT
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-5
-4
-3
-2
-1
25. Sea X el salario por hora de cualquier minero seleccionado al azar y considrese que X se distribuye
normalmente. Si los valores crticos t fueran 2.624, 2.492 y 2.423 para = 0.01 con H1 : > 1, qu
tan grande debera ser el tamao de la muestra para una prueba de una cola?
SOLUCION
La prueba corresponde a una prueba de cola derecha o superior
Ho:
H1:
=1
>1
Buscando en la tabla para la t student, para =0.01 y los valores de t se obtienen directamente
T =2.624, entonces v1 =14 por lo tanto n = v + 1 = 15
T =2.492, entonces v2 =24 por lo tanto n = 24 +1=25
T =2.423, entonces v3 =40 por lo tanto n = 40 +1=41
T=
X
s
n
Para la estimacin de un intervalo para la verdadera media poblacin , con una confianza 1- para
muestras pequeas se tiene
X T / 2
s
s
< X + T / 2
n
n
(5.17)
130
APUNTES DE ESTADISTICA
EJEMPLOS
26. La Federal Food and Drug Administration est realizando una prueba para determinar si una nueva
medicina tiene el indeseable efecto lateral de elevar la temperatura del cuerpo. Se entiende que la
temperatura del cuerpo humano se distribuye normalmente con una media de 98.6 F. Se administra la
nueva medicina a nueve pacientes, se toman las temperaturas y se obtiene una media muestral de 99F
y una desviacin tpica de 0.36 F. Debera permitirse a la compaa poner a la venta la nueva droga si
el nivel de significacin se especifica en 0.01?
SOLUCION
La hiptesis nula y alternativa de problema son
Ho:
H1:
= 98.6
> 98.6
T=
X 99 98.6
=
= 3.333
s
0.36
n
9
Como T > T Se rechaza Ho ya que efectivamente aumenta la temperatura, por lo que no debe salir al
mercado
0.4
0.35
0.3
0.25
0.2
T=3.333
1-
0.15
0.1
0.05
0
-5
-4
-3
-2
-1
Regin de aceptacin
Regin de rechazo
T=2.896
27. Se considera que un proceso de produccin est funcionando en forma adecuada cuando la
cantidad promedio de caf instantneo que se empaca en un frasco es de 6 oz. Se selecciona una
muestra aleatoria de 16 frascos; se determina el promedio muestral como 6.1 oz, con una desviacin
tpica de 0.2 oz. El nivel de significacin se especifica en 0.05. Considrese que la cantidad de caf en
cada frasco tiene una distribucin normal.
a. Est funcionando adecuadamente el proceso?
b. Cules son los lmites de confianza del 95% para su promedio verdadero en vista de la informacin
muestral?
131
APUNTES DE ESTADISTICA
SOLUCION
a) Los datos obtenidos del problema son n = 16, = 6,
El problema se puede plantear como una prueba de dos colas, con las siguientes hiptesis nula y
alternativa.
Ho:
H1:
=6
6
T=
X 6.1 6
=
=2
s
0.2
n
16
Como -T/2 < T < T/2 No se rechaza Ho, La maquinaria funciona adecuadamente.
0.4
0.35
0.3
0.25
-T/2=-2.131
0.2
1-
T/2=2.131
0.15
/2
0.1
/2
0.05
0
-5
T=2
-4
-3
-2
Regin de rechazo
-1
Regin de aceptacin
Regin de rechazo
b) A partir del intervalo de confianza 1- = 0.95, =0.05 por lo tanto para dos colas T/2 =2.131
s
s
< X + T / 2
n
n
0.2
0.2
< < 6.1 + 2.131
6.1 2.131
16
16
X T / 2
132
APUNTES DE ESTADISTICA
28. Se considera que el peso promedio de los reclutas del ejrcito se distribuye normalmente con una
media de 160 lb. En una muestra aleatoria de 25 reclutas, la media es 150 lb y la desviacin tpica es 20
lb.
a. Prubese la hiptesis nula contra la hiptesis alternativa de que el peso promedio de los reclutas ms
recientes del ejrcito es diferente de 160 lb para = 0.02.
b. Obtngase el intervalo de confianza del 98% para la media verdadera.
SOLUCION
a) Para este problema n = 25, = 160, X = 150, s = 20 y = 0.02
El problema plantea una prueba de dos colas, con las siguientes hiptesis nula y alternativa.
Ho:
H1:
=160
160
T=
X 150 160
=
= -2.5
s
20
n
25
0.4
0.35
0.3
0.25
-T/2=-2.492
0.2
1-
T/2=2.492
0.15
T = -2.5
0.1
0.05
/2
0
-5
-4
-3
Regin de rechazo
/2
-2
-1
Regin de aceptacin
Regin de rechazo
b) A partir del intervalo de confianza 1- = 0.98, =0.02 por lo tanto para dos colas T/2 = 2.492
s
s
< X + T / 2
n
n
20
20
150 2.492
< < 150 + 2.492
25
25
X T / 2
133
APUNTES DE ESTADISTICA
29. Supngase que en una lnea area se desea determinar si el peso promedio de las maletas llevadas
por los pasajeros entre Los Angeles y New York es de ms de 40 lb. Se selecciona aleatriamente una
muestra de 16 pasajeros y se obtiene una media de 42 lb y una desviacin tpica de 4 lb. Puede
llegarse a la conclusin de que el peso promedio es de ms de 40 lb con = 0.01, considerando que los
pesos de las maletas se distribuyen normalmente?
a) Los datos obtenidos del problema son n = 16, = 6, X = 42, s = 4 y = 0.01
El problema se puede plantear como una prueba una cola derecha, con las siguientes hiptesis nula y
alternativa.
Ho:
H1:
=40
>40
T=
X 42 40
=
=2
s
4
16
n
0.4
0.35
0.3
0.25
0.2
T=2
1-
0.15
0.1
0.05
0
-5
-4
-3
-2
-1
Regin de aceptacin
Regin de rechazo
T=2.602
134
APUNTES DE ESTADISTICA
En el caso de muestras independientes de tal manera que ninguna se relacione con la otra, se deber
hacer la consideracin adicional de que las muestras provienen de poblaciones con idntica desviacin
tpica con el fin de facilitar el procedimiento, esto es, 1=2.
Como se mencion anteriormente la varianza de la diferencia muestral D = X 1 - X 2 es
D =
21
n1
22
n2
1
1
+
n1 n 2
D 2 = 2
D2
es S D
s2 ,
es
1
1
2
s D = s 2 +
n1 n 2
2
La mejor estimacin de s se puede obtener al considerar que se mezclan los datos de ambas
muestras, en tal caso se obtiene que
s2 =
por lo que el error tpico de la diferencia entre dos medias para muestras pequeas es
(n 1) s12 + (n 2 1) s 22
s D = 1
(n1 + n 2 2)
1
1
+
n1 n 2
(5.18)
1 = 2
1 < 2
1 > 2
1 2
El estadstico de prueba es
T=
( X 1 X 2 ) ( 1 2 )
D
(5.19)
135
APUNTES DE ESTADISTICA
T=
X1 X 2
(n1 1) s + (n2 1) s 22
(n1 + n2 2)
2
1
(5.20)
1
1
+
n1 n2
D T / 2 s D < D + T / 2 s D
o utilizando la expresin (48)
(n 1) s12 + (n 2 1) s 22
D T / 2 1
(n1 + n 2 2)
1
1
+ < < D + T / 2
n
1 n 2
(n 2 1) s12 + (n 2 1) s 22
(n1 + n 2 2)
1
1
+ (5.21)
n
1 n 2
EJEMPLOS
30. Se prueban dos motores distintos de automvil para determinar si presentan diferencias en cuanto a
control de contaminacin. En una prueba de 16 das del Motor I, las medidas indican un ndice promedio
de contaminacin de 60 y una desviacin tpica (s1) de 9; en una prueba de 16 das del Motor II, las
mediciones indican un ndice promedio de contaminacin de 55 y una desviacin tpica (s2) de 9. Se
cree que las mediciones tienen una distribucin normal y varianza idntica, y que las dos muestras son
independientes. Existe suficiente evidencia de que el Motor I y el Motor II tienen distinto control de
contaminacin para = 0.05?
SOLUCION
Los respectivos datos del problema son
Tamao de muestra 1 n1= 36
Promedio 1 X 1 =60,
Desviacin tpica 1 s1=9
1=2
12
136
APUNTES DE ESTADISTICA
Para el nivel de significancia =0.05 y los grados de libertad =30 y una prueba de dos colas T/2=2.042
Sustituyendo los datos en la ecuacin
T=
T=
X1 X 2
(n1 1) s + (n2 1) s 22
(n1 + n2 2)
60 55
2
1
1
1
+
n1 n2
=1.5713
0.4
0.35
0.3
0.25
0.2
-T/2=-2.042
0.15
1-
0.1
T/2=2.042
T = 1.5713
0.05
/2
0
-5
-4
-3
/2
-2
Regin de rechazo
-1
Regin de aceptacin
Regin de rechazo
31. Se desea determinar si los promedios de puntos de calificacin (PPC) son diferentes para nios y
nias. Se considera que el PPC se distribuye normalmente con varianza idntica para ambos sexos.
Dos muestras independientes de cinco estudiantes cada una proporcionan lo siguiente:
PPC para nios: 2.9 3.1 2.7 3.3 3.0
PPC para nias: 3.6 2.8 3.6 3.2 2.8
a. Utilizando = 0.05, prubese la hiptesis de que el PPC medio para nios es el mismo que el PPC
medio para nias, contra la hiptesis alternativa de que las dos medias son diferentes.
b. Obtnganse los lmites de confianza del 95% para la verdadera diferencia entre las dos medias
poblaciones.
SOLUCION.
a) Para la solucin de problema primero es necesario calcular la media y la desviacin tpica insesgada
para cada uno de los datos dados.
Para los nios la media y la varianza son
X1=
137
APUNTES DE ESTADISTICA
s1 =
= 0.05
T=
T=
X1 X 2
(n1 1) s + (n2 1) s 22
(n1 + n2 2)
3 3.2
2
1
1
1
+
n1 n2
(5 1)(0.05) + (5 1)(0.4) 1 + 1
(5 + 5 2)
0.2
= -0.9760
0.2049
sD =
(5 + 5 2)
r
D T < < D + T
-T/2=-2.306
0.15
1-
T/2= 2.306
0.1
T = 0.6666
/2
0.05
0
-5
-4
-3
Regin de rechazo
-2
-1
Regin de aceptacin
/2
2
Regin de rechazo
138
APUNTES DE ESTADISTICA
32. Supngase que se desea determinar si una dieta completada con una hormona de crecimiento
puede aumentar significativamente la ganancia en peso de los cerditos. Con este fin, se seleccionan
aleatriamente dos grupos independientes de cerditos. A un grupo se le alimenta con la dieta
acostumbrada y al otro con una dieta con la hormona de crecimiento. Las ganancias de peso para los
dos grupos se registran un mes despus de que se han estado utilizando las dietas respectivas. a
continuacin se muestran los datos de importancia.
Tamao de la muestra
Media muestral (en libras)
Varianza
Grupo 1
(Dieta acostumbrada)
n1 = 21
X 1 = 16
2
s1 = 35
Grupo 11
(Dieta con hormonas)
n2 = 21
X 2 = 19
2
s2 = 45
Es posible que la dieta completada con una hormona de crecimiento aumente la ganancia en peso de
los cerditos para = 0.05? (Considrese que las ganancias en peso se distribuyen normalmente.)
SOLUCION
Las hiptesis respectivas del problema son:
Ho:
H1:
1=2
2>1
(n1 1) s1 2 + (n2 1) s 2 2
s D =
n1 + n2 2
+ 1
n n
2
1
1
700 + 900 2
(21 1)35 + (21 1)45 1
sD =
= 1.9518
+ =
40
21 + 21 2
21
21 21
El estadstico de prueba es
T=
X 1 X 2 16 19
=
=-1.5370
sD
1.9518
1-
0.15
T=-1.5370
0.1
0.05
0
-5
-4
-3
-2
-1
Regin de rechazo
Regin de aceptacin
T=1.684
139
APUNTES DE ESTADISTICA
Z=
X
s/ n
Z=
X1 X 2
2
s1
s
+ 2
n1
n2
EJEMPLOS
33. Sea Y una variable aleatoria que se sabe tiene una media de 500. Una muestra aleatoria de 900
observaciones para Y proporciona una media Y = 550 y una varianza s2 = 562 500.
a. Prubese la hiptesis de que la media de Y permanece siendo 500 contra la hiptesis alternativa de
que es diferente de 500 con = 0.01.
b. Determnese el intervalo de confianza del 99% para la verdadera media.
SOLUCION
a) Los datos que se tienen del problema son
Media poblacional =500, nmero de datos n = 900, media muestral X =550,
varianza muestral s2 = 562500 y nivel de significancia =0.01
La hiptesis nula y alternativa es
Ho:
H1:
=500
500
Para la prueba de dos colas con =0.01se tiene que /2=0.005 y A =1-/2= 0.995 lo que corresponde de
acuerdo a la tabla respectiva de la distribucin normal Z/2 = 2.575
El estadstico de prueba es
Z=
X 550 500
=
=2
s / n 750 / 900
140
APUNTES DE ESTADISTICA
s
s
< < X + X /2
n
n
750
750
550 2.575
< < 550 + 2.575
900
900
X Z / 2
485.625< <614.375
34. Un productor de azcar la empaca en bolsas de papel, cada una de las cuales debe contener 10 lb
160 oz. Algunos clientes se han quejado de que las bolsas contienen solamente 9.5 lb 152 oz. Se
realiza una prueba para determinar si la queja es razonable. Una muestra aleatoria de 49 bolsas
proporciona una media de 156 oz y una desviacin tpica (s) de 10.5 oz. Deber rechazarse la hiptesis
nula de que el peso promedio es de 160 oz en oposicin a la hiptesis alternativa a de que es de 152 oz
para = 0.01?
SOLUCION
Los datos que se tienen del problema son los siguientes
Media poblacional =160, nmero de datos n = 49, media muestral X =156,
varianza muestral s2 = 10.5 y nivel de significancia =0.01
La hiptesis nula y alternativa es
Ho:
H1:
=160
<160
La prueba es de cola izquierda, para =0.01 se tiene que A =1- = 0.99, por lo que Z= -2.326
El estadstico de prueba es
Z=
X 156 160
=
= -2.666
s / n 10.5 / 49
141
APUNTES DE ESTADISTICA
Para el nivel de significancia =0.10, se tiene que A = 1--=0.90 por lo que Z=- 1.282
El estadstico de prueba es en este caso
Z=
X1 X 2
2
s1
s
+ 2
n1
n2
9 11
20 30
+
40 60
9 11
1
= -2
Puesto que Z < Z se rechaza Ho, la dieta I produce una perdida de peso que la dieta II
La distribucin (chi cuadrada) tambin es conocida como Ji cuadrada y surge como distribucin
reprobabilidad de la variable aleatoria =
2
(n 1) s 2
para algunas pruebas de hiptesis, por ejemplo para la prueba de una sola varianza de la poblacin.
2
P (0 < 2 < x ) =
1
/2
(2
x
0
( 2 )
e t / 2 dt
(5.22)
Funcin
0.45
0.4
0.35
=1
0.3
0.25
0.2
=5
0.15
0.1
=10
=15
0.05
0
10
15
20
25
30
142
APUNTES DE ESTADISTICA
Observndose que la distribucin no tiene simetra para valores pequeos de , tendiendo a la simetra
respecto a una recta perpendicular que pasa pos su valor mximo para valores grandes de , adems, el
2
valor de nunca es negativo pudiendo tomar solamente valores positivos o cero.
Al igual que para las anteriores distribuciones existen tablas de probabilidad acumulada para los valores
de significacin ms utilizados en la prctica que permiten localizar los valores crticos de
2
denotados en ocasiones como , , el primer subndice ndica los grados de libertad y el segundo la
significancia, como la distribucin no tiene valores negativos los valores de para una prueba de cola
izquierda es totalmente diferente que el requerido de cola derecha, por ejemplo, para una distribucin
2
chi cuadrado con grados de libertad para una significancia = 0.05 de cola izquierda se localiza en la
tabla respectiva el valor de =10 y = 0.95, esto es debido a que el rea bajo la curva reportada en la
tabla para la distribucin chi cuadrada se calcula de manera inversa a la reportada en las anteriores
2
0.1
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
10
15
20
25
30
35
40
2 10 , 0.05 =18.307
Figura. Representacin grfica de los valores crticos para la distribucin chi cuadrada para =10 y =
0.95, para una prueba de cola izquierda y cola derecha.
2 =
(n 1) s 2
(5.23)
tiene una distribucin con = n-1 grados de libertad. En la prueba de la varianza se considera que
2 y n son constantes para cada problema particular, por lo que la distribucin de s2 de acuerdo a la
ecuacin (53) tiene una distribucin 2. Por lo tanto se puede utilizar la expresin (53) como el
estadstico de prueba para realizar la prueba de hiptesis para una sola varianza poblacional.
Como en todos los casos de prueba de hiptesis la hiptesis nula se define como
143
APUNTES DE ESTADISTICA
2 = o2
Ho:
H1:
LA VERDADERA VARIANZA
Para obtener el respectivo intervalo de confianza 1- , para la varianza poblacional se procede como en
los casos anteriores utilizando el estadstico de prueba y los respectivos valores crticos 2 /2 inf y
2 /2 sup.
Esto es
2 , / 2 inf <
(n 1) s 2
< 2 , / 2 sup
Invirtiendo la desigualdad
>
, / 2 inf
(n 1) s
>
(n 1) s 2 > 2
2
, / 2 inf
>
, / 2 sup
(n 1) s 2
2 , / 2 sup
Finalmente
(n 1) s 2
2 , / 2 sup
<2 <
(n 1) s 2
(5.24)
2 , / 2 inf
EJEMPLOS
36. Dada una distribucin 2con 20 grados de libertad, obtngase el valor 2 que corta cada una de las
siguientes reas bajo la curva.
a) 2.5 superior
d) 5% interior
b)
e)
10% superior
1% interior
c)
90% superior
SOLUCION
Buscando en la tabla = 20 y los correspondientes puntos porcentuales o noveles de significacin
144
APUNTES DE ESTADISTICA
a)
b)
c)
d)
e)
210, 0.025.=34.1696
210, 0.10.=28.4120
210, 0.90.=12.4426
210, 0.95.10.8508
210, 0.99. 8.2604
37. Obtnganse los puntos porcentuales bajo la cola superior de la distribucin con 16 grados de
libertad, que estn cortados por los siguientes valores chi cuadrada
a. 23.5418
b. 26.2962
c. 31.9999
SOLUCION
Buscando en la tabla de la 2 y en el nmero de grados de libertad =16 los respectivos valores de
rea se tiene directamente que
a)
b)
c)
23.5418
26.2962
31.999
0.10
0.05
0.01
10%
5%
1%
38. En una muestra de 10 observaciones tornadas a partir, de una poblacin normal, se encuentra que la
varianza s2 es 15. Cules son los lmites de confianza del 90% para la varianza de la poblacin?
SOLUCION
Los datos proporcionados en el problema son
Varianza muestral s2 =15
nmero de datos n = 10
1 - = 0.9
16.9190
39. Cuando un proceso de produccin est funcionando adecuadamente, la varianza de las partes
producidas es cuatro. Las medidas de las partes se distribuyen normalmente. Se sugiere que el proceso
de produccin en la actualidad se encuentra fuera de control. Se selecciona aleatriamente una muestra
de nueve partes producidas y se obtienen las siguientes medidas.
9
10
12
13
12
11
a. Obtngase la varianza s2
b. Prubese la hiptesis de que el proceso de produccin sigue funcionando adecuadamente, con =
0.10.
c. Establzcase el intervalo de confianza del 90% para la verdadera varianza (s2, con base en la
informacin muestral.
145
APUNTES DE ESTADISTICA
SOLUCION
( x )
x n
n 1
total
x
10
81
12
100
144
13
169
12
144
64
11
36
121
x
x
9
81
= 90
2
i
=940
sustituyendo
s2 =
940 (90 )
9 1
9 =5
2 =
(n 1) s 2
(9 1)(5) = 10
4
0.1
0.08
0.06
0.04
1-
/2
2 =10
/2
0.02
10
15
20
25
30
35
40
Regin de rechazo
146
APUNTES DE ESTADISTICA
c) Evaluando la ecuacin
(n 1) s 2
<2 <
2 , / 2 sup
(n 1) s 2
2 , / 2 inf
15.5073
2.5794<2<14.6378
40. Se sugiere que despus de firmar un contrato laboral, la produccin por hora de los trabajadores
mostrar una variacin mayor que antes de firmar el contrato. Se sabe que la varianza de las
producciones por hora antes del contrato laboral era de 2 = 80. Considrese que las producciones por
hora se distribuyen normalmente. Se selecciona una muestra aleatoria de 30 trabajadores y se obtienen
sus producciones por hora despus de la firma del contrato. Se encuentra que la varianza de la muestra
es 90 (s2 = 90). Debe llegarse a la conclusin de que la dispersin de las producciones por hora ha
aumentado significativamente, con = 0.05?
SOLUCION
La varianza poblacional es 2 = 80, la varianza muestral es s2 = 90, el tamao de muestra es 30 y el nivel
de significancia es = 0.05, entonces los grados de libertad son =30 - 1 = 29.
Las hiptesis de la prueba son
Ho: 2 = 80
Hi: 2 > 80
Situacin correspondiente a una de cola derecha.
Para estas condiciones el valor crtico es 229, 0.05 = 42.5570 y en valor del estadstico de prueba
2 =
(n 1) s 2
0.06
0.05
0.04
0.03
1-
0.02
2 =32.6250
0.01
10
20
Regin de aceptacin
30
40
50
60
Regin de rechazo
28, 0.05=42.5570
147
APUNTES DE ESTADISTICA
E1
E2
E3
EJ
II
O1
O2
O3
OJ
(Ok E k )2
k =1
Ek
=
2
(5.25)
Donde la sumatoria se lleva a cabo sobre todas las frecuencias clases (J) en que han sido dividido los
datos. Cuando el tamao de la muestra es grande de tal manera que ninguna frecuencia esperada es
menor a 5, 2 se distribuye aproximadamente siguiendo un distribucin chi cuadrada con = J 1,
grados de libertad.
Por la definicin dada al estadstico de prueba en la ecuacin (55), la prueba de hiptesis es de una cola
derecha, que indica que el ajuste o comparacin con la distribucin esperada es bueno si la diferencia
entre los valores observados son muy parecidos a los esperados dando por resultado un valor de 2
pequeo, pero cuando el valor de 2 es ms grande que un valor especificado (valor crtico 2, ), la
hiptesis nula se rechaza indicando que no existe suficiente evidencia para decir que los datos
propuestos tienen la distribucin propuesta.
EJEMPLOS
41. Se supone que una tabla de dgitos aleatorios es no sesgada; esto es, cada uno de los 10 dgitos
debe tener la misma probabilidad de aparecer. Para probar si ste es o no en realidad el caso, se
selecciona una muestra de 100 dgitos y se obtienen los siguientes resultados.
Dgito:
0 1 2 3 4 5 6 7
8 9
Total
Nmero de veces:
que aparece
8 11 10 14 7 12 6 9 13 10
100
Debera rechazarse la hiptesis de que los dgitos de la tabla estn arreglados aleatriamente, con =
0.05?
SOLUCION
El nmero de clases es J = 10, por lo tanto, los grados de libertad son = J 1 = 10 -9 = 9.
Para el nivel de significancia = 0.05 y 9 grados de libertad el valor crtico es 2v,= 29, 0.05=16.9190
Considerando la distribucin uniforme, se tiene que el valor esperado correspondiente es
Dgito:
Frecuencia esperada
0 1 2 3
10 10 10 10
4 5
10 10
6
10
7
10
8 9
10 10
Total
100
148
APUNTES DE ESTADISTICA
(Ok E k )2
k =1
Ek
=
2
=(8-2)2/10+(11-10)2/10+(10-10)2/10+(14-10)2/10+(7-10)2/10+(8-10)2/10+
+ (6-10)2/10+(9-10)2/10+(13-10)2/10+(10-10)2/10=6
Como 6 < 16.9190 no se rechaza Ho, La distribucin si es uniforme.
0.12
0.1
0.08
0.06
1-
0.04
2 =6
0.02
10
15
20
Regin de aceptacin
25
30
Regin de rechazo
9, 0.05=16.9190
42. Se arrojan simultneamente cuatro monedas balanceadas 160 veces. A continuacin se muestran
los resultados.
Nmero de caras:
Frecuencia observada:
0
16
1
35
2
55
3
48
4
6
Total
160
Con = 0.05, prubese la hiptesis nula de que las cuatro monedas estn todas bien balanceadas y
fueron arrojadas aleatriamente.
SOLUCION
La distribucin de probabilidad para el experimento de arrojar cuatro monedas balaceadas se muestra a
continuacin
x
f(x)
0
1/16
1
4/16
2
6/16
3
4/16
4
1/16
0
10
1
40
2
60
3
40
4
10
Total
160
149
APUNTES DE ESTADISTICA
El estadstico de prueba es
J
2 =
(Ok E k )2
Ek
k =1
40
60
40
10
= 7.8417
Como 7.8417 < 9.48773 no se rechaza Ho, las monedas se encuentran bien balanceadas.
0.2
0.18
0.16
0.14
0.12
0.1
0.08
2 =7.8417
1-
0.06
0.04
0.02
0
Regin de aceptacin
10
12
14
16
18
20
Regin de rechazo
29, 0.05=9.48773
43. En un experimento con chcharos, un bilogo observa 186 plantas altas y coloridas, 66 altas y sin
color, 54 bajas y coloridas, y 14 bajas y sin color. De acuerdo a la teora de la herencia de Mendel, sera
de esperarse que las diferentes categoras tuvieran las siguientes proporciones: 9:3:3:1. Existe
suficiente evidencia para apoyar la teora de Mendel, al nivel de significacin del 0.01?
SOLUCION
La informacin de la frecuencia observada del experimento se resume en la siguiente tabla
Clases
Altas y color
Frecuencia 186
observada
Total
66
54
14
320
Las proporciones del problema son 9:3:3:1, lo cual se puede traducir en trminos de la probabilidad en
9x + 3x + 3x +x = 1, de donde x = 1/16, por lo que las frecuencias esperadas son
9/16x320=180
Clases
3/16x320=60
Altas y color
Frecuencia 180
esperada
3/16x320=60
1/16x320
Total
60
60
20
320
150
APUNTES DE ESTADISTICA
El estadstico de prueba es
J
2 =
(Ok E k )2
Ek
k =1
60
60
20
= 3.2
Como 3.2 < 11.3449.no se rechaza Ho el experimento cumple las leyes de Mendel.
0.25
0.2
0.15
1-
0.1
2 =3.2
0.05
Regin de aceptacin
10
12
14
16
18
20
Regin de rechazo
3, 0.01=11.3449
2
PRUEBA DE INDEPENDENCIA
Otro tipo de prueba donde se puede aplicar la distribucin chi cuadrado en la prueba de independencia
donde se toma la decisin acerca de si una variable es independiente de la otra de otra variable. La
hiptesis nula se establece suponiendo que son independientes. Los datos se acomodan en una tabla
llamada tabla de contingencia, en la cual existe N clases o categoras de rengln y M clases o
categoras de columna. Al final de cada una de las filas o columnas se escriben los totales marginales
de fila Rj o columna Ck. La interseccin de cada columna y fila da una celda Cjk que es la frecuencia
observada. A continuacin se muestra una tabla de contingencia general.
R1
C31
---
---
---
--- ---
---
R2
---
---
---
---
--- ---
---
---
CjM
Rj
---
---
CNM
RN
C1
CM
Cj1 Cj2
---
---
C2
Cjk
---
---
---
Ci
--- ---
--- Ck
El estadstico de prueba es una generalizacin del utilizado el la prueba de bondad de ajuste, por lo que
es necesario calcular primero los valores esperados Ejk, los cuales se pueden obtener a partir de los
151
APUNTES DE ESTADISTICA
totales marginales de fila Rj, los totales marginales de columna Ck y el nmero total de datos n, mediante
la siguiente ecuacin.
E jk =
R j Ck
(5.26)
=
2
j =1 k =1
(C jk E jk ) 2
(5.27)
E jk
La cual tiene una distribucin chi cuadrado con = (N 1)(M - 1) nmero de grados de libertad.
La prueba es una prueba de cola derecha, y se rechazar la hiptesis nula H0 si el valor del estadstico
de prueba es lo suficientemente grande para superar el valor crtico establecido a partir de la
significancia y de el nmero de grados de libertad . El rechazo de la hiptesis nula implicar que las
variables son dependientes, en caso contrario sern independientes.
EJEMPLOS
44. Supngase que la siguiente es la distribucin de frecuencias observada de 1000 votantes
clasificados segn el partido al que estn afiliados y su preferencia al votar con respecto a cierto asunto.
Pref. al votar
Demcratas Republicanos
Total
En contra
250
200
450
A favor
400
150
550
Total
650
350
1000
Prubese la hiptesis de que la preferencia al votar no esta relacionada con la afiliacin de partido, con
= 0.05.
SOLUCION
A partir de los totales marginales y el total de datos se obtienen los valores esperados Eij utilizando la
ecuacin E jk =
R j Ck
n
Pref. al votar
Demcratas Republicanos
Total
En contra
292.5
157.5
450
A favor
357.5
192.5
550
Total
650
350
1000
152
APUNTES DE ESTADISTICA
2 =
(C jk E jk ) 2
E jk
j =1 k =1
157.5
357.5
192.5
= 32.079
El nmero de grados de libertad para el problema es = (2 1)(2 - 1) = 1, Por lo que el valor crtico es
2v,= 21, 0.05=3.84146
Puesto que 3.84146< 32.079 se rechaza Ho, por lo que si hay dependencia en las variables,
45. Se realiza una investigacin para determinar si la calificacin de desempeo en el trabajo es
independiente de los logros acadmicos en universidad. Se selecciona aleatriamente una muestra de
100 empleados y su clasificacin en una tabla de 3 por 3 se muestra a continuacin.
Nivel acadmico en universidad
Calificacin de
desempeo
C o menos
Total
Excelente
10
20
Promedio
20
12
40
Malo
20
13
40
Total
50
30
20
100
E jk =
R j Ck
n
C o menos
Total
Excelente
10
20
Promedio
20
12
40
Malo
20
12
40
Total
50
30
20
100
=
2
j =1 k =1
(C jk E jk ) 2
E jk
20
20
12
153
APUNTES DE ESTADISTICA
= 0.54166
El nmero de grados de libertad para el problema es = (3 1)(3 - 1) = 4, Por lo que el valor crtico para
= 4 y = 0.01es 2v,= 24, 0.01=13.2767
Puesto que 0.54166< 13.2767 no se rechaza Ho, por lo que las variables son independencia.
46. Un psiclogo realiz un experimento para determinar si el desempeo de los estudiantes est
relacionado con el mtodo utilizado en cierto tema. Se estn considerando tres mtodos de enseanza:
I, II, y III, y el desempeo de los estudiantes se clasifica como A, B o C. Los resultados fueron los
siguientes.
Prubese la hiptesis nula de que el desempeo de los estudiantes no est relacionado con el mtodo
de enseanza, con = 0.01.
SOLUCION
Construyendo primero la tabla de continencia de los valores esperados utilizando la ecuacin
E jk =
R j Ck
n
Desempeo I
A
B
C
Total
METODOS DE ENSEANZA
III
III
7.5
10
7.5
25
15
20
15
50
7.5
10
7.5
25
Total
30
40
30
100
2 =
(C jk E jk ) 2
E jk
j =1 k =1
10
7.5
7.5
10
7.5
15
20
= 8.73
El nmero de grados de libertad para el problema es = (3 1)(3 - 1) = 4, Por lo que el valor crtico es
2v,= 2 4,0.01=13.2767
Puesto que 8.73< 13.2767 no se rechaza Ho, por lo que no hay dependencia en las variables,
154
APUNTES DE ESTADISTICA
PRUEBA DE FISHER
R. A. Fisher, quien fue el primero en obtener la distribucin y desarrollar la prueba, de ah el nombre de
la distribucin. La prueba f se utiliza principalmente para probar la igualdad entre dos varianzas
poblacionales que provienen de poblaciones que tiene una distribucin normal, tambin se ha
desarrollado un procedimiento basado en esta prueba para investigar la igualdad entre tres ms
medias poblacionales, procedimiento que comnmente se denomina anlisis de varianza (ANOVA).
El estadstico de prueba para la prueba F es la razn de los estimadores insesgados de
varianzas poblacionales
F=
s1
s2
de dos
(5.28)
Se debe cumplir siempre que s12>s22 para que la razn sea mayor que uno (F 1).
La probabilidad acumulada para la distribucin Fisher se obtiene de la siguiente ecuacin
( + 2 ) 1 / 2 2 / 2
1
1 2
2
P (0 < F < x ) =
1 2
2 2
t ( 1 / 2 )1 ( 2 + 1t )
( 1 + 2 ) / 2
dt
(5.29)
La distribucin F tiene 2 variables 1 y 2 que son los grados de libertad de cada una de las poblaciones.
grados de libertad de la poblacin 1
1= n1 - 1
grados de libertad de la poblacin 2
2= n2 1
Entonces, para cada pareja de valores 1 y 2 se tendr una tabla correspondiente a los valores
porcentuales de ms utilizados. En general los valores crticos F, 1, 2 es diferente de F, 2, 1, esto
es, si se intercambian los valores de 1 y 2 no se obtiene el mismo valor crtico, por lo que hay que tener
cuidado al utilizar las tablas y recordar que 1 se asocia la poblacin que tiene la mayor varianza y 2.a la
que tiene la menor varianza. Algunas grficas de la distribucin F se muestran a continuacin. Se
observa que la distribucin no tiene simetra en ningn caso mostrado.
1
0.9
F1, 4
0.8
0.7
0.6
F3, 8
0.5
0.4
F8, 10
0.3
0.2
0.1
0
0.5
1.5
2.5
3.5
4.5
155
APUNTES DE ESTADISTICA
12=22
H1:
12>22
1222
s1
s2
nula se rechazar si el valor de F es lo suficientemente grande para que sea mayor que el valor crtico
F, 1, 2.
EJEMPLOS
47. Supngase que se comparan las materias primas suministradas por dos proveedores. En apariencia
los dos proveedores proporcionan materiales distribuidos normalmente con el mismo promedio, pero
existe preocupacin en cuanto a la variabilidad de los materiales. Una muestra de 16 lotes del Proveedor
I proporciona una varianza de 150 (s12 = 150), mientras que una muestra de 21 lotes provenientes del
Proveedor II proporciona una varianza de 225 (s22 = 225). Prubese la hiptesis nula de que sus
varianzas verdaderas son iguales contra la hiptesis alternativas de que son diferentes, con = 0.05.
SOLUCION
Los datos de cada un de los proveedores se resumen a continuacin (reacurdese que s12>s22)
Proveedor I
s22=150
n2 =16
Proveedor II
s12=225
n1=21
Ho:
H1:
F=
s1
s2
225
=1.5
150
Como 1.5 < 2.76, no se rechaza Ho, las varianzas son estadsticamente iguales.
156
APUNTES DE ESTADISTICA
1
0.9
0.8
0.7
0.6
1-
0.5
0.4
0.3
F =1.5
/2
0.2
/2
0.1
0
0.5
Regin de rechazo
1.5
2.5
Regin de aceptacin
3.5
4.5
Regin de rechazo
48. Se emplean dos mtodos de enseanza de la lectura a dos grupos seleccionados aleatriamente de
nios de nueve aos. Se desea determinar si los resultados de los dos mtodos, en trminos de las
puntuaciones obtenidas en una prueba estndar de lectura, tienen la misma variabilidad. Supngase que
se obtienen los siguientes datos de las dos poblaciones consideradas como normales:
Tamao de la muestra
Varianza muestral
Mtodo I
Mtodo II
n1 = 25
s12 = 108
n2 = 30
s22 = 95
Con un nivel de significacin de 0.05, debera llegarse a la conclusin de que las puntuaciones de
prueba de los dos grupos tienen la misma varianza poblacional?
SOLUCION
En este caso la hiptesis nula y alternativa de problema son
Ho:
12=22
H1:
1222
Utilizando el nmero de datos de cada muestra, 1=25 1 = 24 y 2=30 1 = 29.
La prueba es de dos colas, entonces como =0.05, /2=0.025
El valor crtico para la prueba es F0.025, 24, 29 = 2.15, por otra parte estadstico de prueba es
F=
s1
s2
108
=1.1368
95
Como 1.1368 < 2.15, no se rechaza Ho, las varianzas son estadsticamente iguales.
0.8
1-
0.6
0.4
F = 1.1368
/2
0.2
0.5
Regin de rechazo
/2
1.5
Regin de aceptacin
2.5
Regin de rechazo
F0.025, 20, 15 = 2.15
157
APUNTES DE ESTADISTICA
49. Un psiclogo desea determinar si la inteligencia de las nias ms variable que la de los nios. Se
sabe que los C.I. tanto de nios como de nias se distribuyen normalmente. Supngase que una
muestra aleatoria de los C.I. de 61 nias proporciona una varianza de s12 = 240, y una muestra aleatoria
de los C.I. de 61 nios proporciona una varianza de s22 = 200. Con = 0.01, prubese la hiptesis nula
de que la variabilidad de los C.I. de las nias es igual que la de los nios, contra la hiptesis alternativa
de que la primera es mayor que la segunda.
SOLUCION
Los datos para el grupo de nios y nias se resumen a continuacin
Nias
Nios
s12=240
s22=200
n2=61
n1=61
La hiptesis nula y alternativa de problema son respectivamente
12=22
12 > 22
Ho:
H1:
F=
s1
s2
240
=1.2
200
Como 1.2 < 1.84, no se rechaza Ho, las varianzas son estadsticamente iguales.
1.8
1.6
1.4
1.2
1
0.8
1-
0.6
F =1.2
0.4
0.2
0
0.5
Regin de aceptacin
1.5
2.5
Regin de rechazo
F0.01, 60, 60 = 1.84
158
APUNTES DE ESTADISTICA
50. Se emplean dos mquinas, I y II, para producir pernos idnticos cuyas longitudes se cree que se
distribuyen normalmente. Una muestra aleatoria de 41 pernos producidos por la mquina I da una
s12=0.5, una muestra de 61 pernos producidos por la mquina II da una s22 =0.3. Pruebe la hiptesis nula
de que pernos producidos por las dos mquinas tienen variabilidad idntica, contra la hiptesis
alternativa de que tiene varianza diferente, con =0.10.
SOLUCION
Las varianzas y nmero de datos se resumen a continuacin para cada mquina
Maquina I
s12=0.5
n1=41
Maquina II
s22=0.3
n2=61
F=
s1
s2
108
=1.66
95
Como 1.59 < 1.66, se rechaza Ho, las varianzas son estadsticamente diferentes.
1.8
1.6
1.4
1.2
1
0.8
1-
0.6
F = 1.66
0.4
/2
0.2
0
/2
0.5
Regin de rechazo
1.5
Regin de aceptacin
F0.05, 40, 60 = 1.59
2.5
Regin de rechazo
159
APUNTES DE ESTADISTICA
Ho:
H1:
La descripcin del mtodo se realizar mediante el siguiente ejemplo, en donde cada columna muestra
las calificaciones obtenidas al aplicar un mtodo de aprendizaje, hay tres mtodos diferentes, por lo que
la hiptesis nula es que los tres mtodos producen resultados idnticos y la hiptesis alternativa es que
producen resultados diferentes.
1=2=3
123
Ho:
H1:
METODO I
74
78
73
73
72
Total
METODO II
84
77
79
79
81
METODO III
83
85
86
87
89
400
470
370
A partir de la suma total de cada mtodo se determina las medias para cada uno de los mtodos
utilizando la frmula para el promedio x =
xi
clase.
x1 = 370/5=74
x2 = 400/5=80
x3 = 430/5=86
Las respectivas varianzas insesgadas de cada mtodo se pueden calcular aplicando
s12=
(74 74)
s2 =
( x i x )2
n 1
160
APUNTES DE ESTADISTICA
s22=
(84 80)2 + (77 80)2 + (79 80)2 + (79 80)2 + (81 80)2 =7
5 1
(83 86) + (85 86) + (86 86)2 + (87 86)2 + (89 86)2 =5
s32=
5 1
2
x=
sx =
(x
x)2
n 1
= 36
x 2 = s x 2 =36
Por otra parte recordando el teorema del lmite central
x =
2
2
n
2 = n x 2 = 5(36) = 180
Lo anterior muestra como la varianza para las medias se transforma en un estimador de la varianza de
una poblacin.
Como 2 se obtiene a partir de las 3 medias que representan a cada uno de los mtodos, por lo que sus
grados de libertad son 1 = 3 -1 = 2.
Para un coso ms general donde existan K clase se tendr que los grados de libertad para 2 son
general.
1 =K-1
La estimacin de 2 mejora si se utiliza toda la informacin disponible de las muestras, por lo que un
mejor estimador sera el promedio de cada de las varianzas individuales s12, s22 y s32,
K
sW =
2
i =1
si
5.5 + 7 + 5
=
= 5.83
K 1
3 1
2 = n1 + n2+ nk K = N - k
Donde nk, es el nmero de datos en la clase k y N es el nmero total de datos.
Para el presente ejemplo 2 = 5+ 5+ 5 3 = 12
161
APUNTES DE ESTADISTICA
F=
s x2
sW2
F=
180
= 30.9
5.83
Para aceptar o rechazar la hiptesis nula, se requiere de un valor crtico, por ejemplo si si =0.05
F, 1, 2 = F0.05,2,12 = 3.89
Puesto que 3.89 < 30.9 Se rechaza Ho, lo que se traduce en que los mtodos de aprendizaje son
diferentes.
Mtodo general
En general si se tiene una tabla con K muestras o clases y cada muestra tiene nk datos como se muestra
a continuacin
Muestra I
Muestra II
Muestra K
x21
x22
.
.
x2n
n2
Tamao de la muestra
x11
x12
.
.
x1n
n1
xk1
xk2
.
.
xkn
nk
Total de la muestra
T1
T2
Tk
Total de la muestra k
TK = X i , k
i =1
nk
T = X i , j
j =1 i =1
N = n1+ n2+nk =
n
i =1
Recordando que el estadstico de prueba se defini como la razn de la varianza entre las medias
muestrales y la varianza dentro de cada una de las muestras.
La suma externa de cuadrados se define como
2
Tk
T2
N
k =1 n k
K
SSB =
(5.30)
162
APUNTES DE ESTADISTICA
Tk
k =1 n k
K
SSW = xi , j
2
j =1 i =1
(5.31)
(5.32)
nk
SST = xi , j
2
j =1 i =1
T2
N
(5.33)
S B2 =
SSB
K 1
(5.34)
SW2 =
SSW
NK
(5.35)
F=
s B2
sW2
(5.36)
Fuentes de
variacin
Dentro de los
grupos
Tk
T2
N
k =1 n k
K
Entre grupos
SSB =
nk
nk
j =1 i =1
2= N - K
T2
N
N-1
SST = xi , j
2
1= K-1
Tk
k =1 n k
K
SSW = xi , j
j =1 i =1
Total
Grados de
libertad
Suma de cuadrados
Varianza
S B2 =
SSB
K 1
SW2 =
SSW
NK
Razn F
F=
s B2
sW2
163
APUNTES DE ESTADISTICA
EJEMPLOS
51. Utilizando los datos del ejemplo anterior y las frmulas (60) y (61) obtenga: SB2 y Sw2 y F.
SOLUCION
Mtodo I
X1
74
78
73
73
72
370
Total
Mtodo II
X2
84
77
79
79
81
400
Mtodo III
X3
83
85
86
87
89
470
Mtodo I
X12
5476
6084
5329
5329
5184
27402
Numero de clases
K = 3.
N = n1+ n2+nk = 5 + 5+ 5 = 15
T1=370
T2=400
Mtodo II
X22
7056
5929
6241
6241
6561
32028
Mtodo III
X32
6889
7225
7396
7589
7921
37000
T3=430
Tk
T 2 370 2 400 2 430 2 1200 2
=
+
+
= 360
N
5
5
5
15
k =1 n k
K
SSB =
1 = K -1 = 3 -1 =2
Grados de libertad
S B2 =
SSB 360
=
=180
K 1 3 1
nk
SSW = xi , j
j =1 i =1
Grados de libertad
SW2 =
2 = N -K = 15 -3 =12
SSW
70
=
= 5.833
N K 15 3
El estadstico de prueba es
F=
s B2
180
=
= 30.86
2
sW 5.833
164
APUNTES DE ESTADISTICA
52. A tres grupos de pollos seleccionados aleatriamente se les alimenta con tres dietas diferentes. Cada
grupo consta de cinco pollos. Sus aumentos de peso durante un periodo especfico de tiempo son los
siguientes:
Dieta I
Dieta II
4
4
7
7
8
3
4
5
6
7
Dicta III
6
7
7
7
8
Utilcese =0.05 para probar la hiptesis nula de que las tres dietas tienen el mismo efecto en el
aumento de peso de los pollos, contra la hiptesis alternativa de que tienen distintos efectos.
SOLUCION
Un resultado interesante es que la suma externa de cuadrados y la suma interna de cuadrados no se ven
alteradas si a cada dato de la tabla se le suma o resta un nmero fijo.
Haciendo uso de la idea anterior conviene restarle a cada dato el nmero 7
Total
Dieta
I
X1
-3
-3
0
0
1
-5
Dieta
II
X2
-4
-3
-2
-1
0
-10
Dieta
III
X3
-1
0
0
0
1
0
Dieta
I
X12
9
9
0
0
1
19
Dieta
II
X22
16
9
4
1
0
30
Dieta
III
X32
1
0
0
0
1
2
v2 =N K = 15 - 3=12
T1= -5
T2= -10
T3=0
T = -5 - 10 + 0=-15
5
5
5
15
N
k =1 n k
K
SSB =
165
APUNTES DE ESTADISTICA
por lo tanto
S B2 =
SSB
10
=
=5
K 1 3 1
nk
SSW = xi , j
j =1 i =1
SW2 =
2
5 2 ( 10)2 0 2
Tk
+
+ = 26
= 19 + 30 + 2
5
5
5
k =1 n k
SSW
26
=
= 13/6 = 2.1667
N K 15 3
El estadstico de prueba es
s B2
5
F= 2 =
= 2.307
sW 2.1667
Como 2.307 <3.89, no se rechaza Ho, las dietas son igualmente efectivas.
53. Una compaa manufacturera tiene cuatro mquinas idnticas en un proceso especifico de
produccin. Cada mquina es operada por un trabajador distinto.
Se toma de cada mquina una muestra de los productos obtenidos durante un periodo de cinco horas y
se obtiene el nmero de partes defectuosas producidas cada hora. Los resultados son los siguientes:
Mquina I
Mquina II
Mquina III
Mquina IV
10
9
9
9
8
7
7
8
8
5
2
3
3
3
4
3
3
6
6
7
Utilizando = 0.01, prubese la hiptesis nula de que las mquinas producen el mismo promedio de
partes defectuosas por hora, contra la hiptesis alternativa de que los cuatro promedios son diferentes.
SOLUCION
Restando el numero 6 a cada elemento de tabla
MI
X1
4
3
3
3
2
15
M II
X2
1
1
2
2
-1
5
M III
X3
-4
-3
-3
-3
-2
-15
M IV
X4
-3
-3
0
0
1
-5
MI
X12
16
9
9
9
4
47
Total
El
nmero de clases es K = 4 y el nmero total de datos es N =20
M II
X22
1
1
4
4
1
11
M III
X32
16
9
9
9
4
47
M IV
X42
9
9
0
0
1
19
166
APUNTES DE ESTADISTICA
v2 =N K = 20 - 4=16
T1= 15
T2= 7
T3=15
T4=47
T = 15 + 5 - 15 -5 = 0
=
+
N
5
5
5
5
20
k =1 n k
K
SSB =
por lo tanto
S B2 =
SSB 100
=
= 33.3333
K 1 4 1
nk
2
(15)2 (5)2 ( 15)2 ( 5)2
Tk
= 47 + 11 + 47 + 19
+
+
+
= 24
5
5
5
k =1 n k
5
K
SSW = xi , j
j =1 i =1
SW2 =
24
SSW
=
= 1.5
N K 20 4
El estadstico de prueba es
F=
s B2 33.3333
=
= 22.222
1.5
sW2
Como 5.29 < 22.222, se rechaza Ho, los promedios de produccin son diferentes.
167
APUNTES DE ESTADISTICA
REGRESION LINEAL
La regresin lineal se refiere a determinar la mejor ecuacin lineal de la forma: y = m x + b que es
posible establecer entre las variables X y Y. En muchas ocasiones la relacin entre las variables es no
lineal lo cual complica el problema, pero en muchos casos es posible determinar una relacin entre las
variables de la forma: y = f(x), donde f(x) puede ser una relacin polinomial, potencial, exponencial. etc.
El trabajo de aplicar la regresin lineal a un problema consiste en determinar los valores parmetros a
y b de la recta y = m x + b a partir del conjunto de datos X y Y
DIAGRAMA DE DISPERSIN
Como primer paso para la obtencin de una regresin primero se grafican los datos, lo cual es conocido
como diagrama de dispersin. En la figura A siguiente se muestran una tabla de datos y su respectivo
diagrama de dispersin.
168
APUNTES DE ESTADISTICA
DIAGRAMA DE DISPERSION
TABLA DE DATOS
35
30
x1
x2
.
.
.
xn
y1
y2
.
.
.
yn
25
20
Y
15
10
10
15
30
25
20
y = mx+b
Yi
15
Yri
10
10
15
169
APUNTES DE ESTADISTICA
La diferencia Di = Yi Yri se denomina desviacin, por lo que la idea bsica del mtodo de mnimos
cuadrados se puede expresar matemticamente como:
n
i =1
(6.1)
i =1
S (m, b) = Di = (Yi mX i b) 2
2
i =1
(6.2)
i =1
La funcin debe S(m, b) se considera como una funcin de dos variables m y b para la cual debe de
existir al menos un par de valores (m, b) tales que sean un mnimo de la funcin.
La condicin que debe de cumplir la funcin S(m, b) para tener un mnimo (o mximo) es que sus
derivadas parciales con respecto a los parmetros m y b sean cero, esto es:
S
=0
m
(6.3)
S
=0
b
(6.4)
mX
b
)
=
i
i
2(Yi mX i b)( X i )
m m i =1
i =1
2
2
S (m, b) = 2 (Yi X i + mX i + bX i ) = 2 Yi X i + m X i + b X i
i =1
i =1
i =1
i =1
2
2 Yi X i + m X i + b X i = 0
i =1
i =1
i =1
i =1
i =1
m X i + b X i = + Yi X i
i =1
(6.5)
170
APUNTES DE ESTADISTICA
S
n
n
=
(Yi mX i b) 2 = 2(Yi mX i b)(1)
b m i =1
i =1
Aplicando nuevamente las propiedades de la sumatoria
n
n
n
S (m, b) = 2 (Yi + mX i + b) = 2 Yi + m X i + b n
i =1
i =1
i =1
Igualando a cero
n
n
2 Yi + m X i + b n = 0
i =1
i =1
i =1
i =1
m X i + b X i = + Yi X i
2
i =1
(6.6)
Las ecuaciones 5.41 y 5.42 forman un sistema de de ecuaciones donde m y b son las incgnitas,
n
m X i + b X i = X i Y i
2
i =1
n
i =1
i =1
m X i + b n = Y i
i =1
i =1
X
=
X
1 =
2
i
Yi
X
=
X
= n X i Yi X i Yi
2
i
X
Y
= n X i ( X i )
X Y = X Y X X
Y
i
Yi
De donde se obtiene las ecuaciones que permiten obtener los parmetros para la mejor recta de
mnimos cuadrados.
m=
1 n X i Yi X i Yi
=
2
2
n X i ( X i )
(6.7)
171
APUNTES DE ESTADISTICA
b= 2 =
X Y X X Y
n X ( X )
2
i i
(6.8)
Como se puede observarse de las ecuaciones anteriores, para obtener los parmetros m y b es
necesario realizar las sumatorias indicadas a partir de los datos (Xi ,Yi) donde i =1, 2, 3,,n.
EJEMPLOS
1. En una compaa de seguros se desea determinar la relacin entre la experiencia en ventas y el
volumen de las mismas. Se selecciona una muestra aleatoria de nueve vendedores. Se encuentra que
sus aos de experiencia (X) y ventas anuales normales (Y) son los siguientes:
X 1 2 3
Y: 2 1 3
4
3
5
4
6
5
7
6
8
5
9
7 (en $100 000)
a) Es conveniente primero
el fin de determinar las
clculo de m y b
X2
1
4
9
16
25
36
49
64
81
285
Y
2
1
3
3
4
5
6
5
7
36
XY
2
2
9
12
20
30
42
40
63
220
m=
n X i Yi X i Yi
n X i ( X i )
(9)(220) (45)(36) =
(9)(285) (45)2
X Y X X Y
b=
n X ( X )
2
i i
2
= 0.6667
3
2
2
x+
3
3
172
APUNTES DE ESTADISTICA
5
X
b) El volumen de ventas anuales para un vendedor que tiene una experiencia en venta de 10 aos se
obtiene al evaluar la recta de regresin obtenida para x =10.
y=
2
2
2
2
x + = y = (10 ) + = 7.33
3
3
3
3
.X
2
1
3
2
1
3
Y
$ 70
40
l00
80
30
100
Obtngase la ecuacin de regresin con X como variable independiente y Y como variable dependiente.
Cul sera el costo de mantenimiento para una mquina de cuatro aos?
SOLUCION
La tabla siguiente resume los clculos necesarios para las sumatorias
X
2
1
3
2
1
3
12
Y
70
40
100
80
30
100
420
XY
140
40
300
160
30
300
970
X2
4
1
9
4
1
9
28
173
APUNTES DE ESTADISTICA
m=
n X i Yi X i Yi
n X i ( X i )
X Y X X Y
b=
n X ( X )
2
i i
(28)(420) (12)(970) = 5
(6)(28) (12)2
y = (32.5)(4 ) + 5 =135
Por lo que el costo de reparacin de la maquina de 4 aos es $135.
CORRELACIN
Como ya se ha sealado anteriormente, la correlacin es la fuerza de la relacin entre las variables X y
Y, y se determina mediante el coeficiente de correlacin.
COEFICIENTE DE CORRELACIN
A partir de la ecuacin de mnimos cuadrados se puede realizar una prediccin de el valor de Y
sustituyendo el valor respectivo X, pero el grado de exactitud de la prediccin depende de el grado de
correlacin entre las variables X y Y. Cuando la correlacin es pequea se tiene poca precisin en la
determinacin del valor Y, pero cuando la correlacin es grande se tiene una gran exactitud en la
determinacin del valor Y.
La medida del grado de correlacin utilizando los n pares de datos (Xi ,Yi) es llamado coeficiente de
correlacin, normalmente denotado por r. Para determinar a r se considera primero que Y es una
variable aleatoria cuya desviacin respecto de la recta de mnimos cuadrados es la menor posible, esto
quiere decir que la variabilidad se divide en dos partes, la primera es la eliminada por la recta de
mnimos cuadrados y la cantidad que permanece a pesar de de la recta de regresin. Si Yr = m X + b
(valor calculado a partir de la recta de regresin) y Y =
1 n
Yi , entonces la variacin total se puede
n i =1
separar de la forma.
(Y
(Yr Y )
Y )2 =
Variacin total
(Y
Variacin eliminado
por regresin
Yr ) 2
(6.9)
Variacin restante
Mientras ms variacin se elimine mediante la recta de regresin ms cercana ser la relacin entre X y
Y y se volver ms precisa la estimacin del valor Y.
Dividiendo ambos lados de la ecuacin 68 entre
(Y
(Y
Y ) 2 = (Yr Y ) 2
Y )2
(Y
Y )2
(Y Yr)
(Y Y )
(Y Y )
se obtiene
174
APUNTES DE ESTADISTICA
1= r
(Y Yr)
+
(Y Y )
r=
(Y Yr)
1
(Y Y )
(6.10)
En lugar de usar la ecuacin anterior para determinar el coeficiente de correlacin se utiliza para el caso
de la lnea recta la frmula siguiente
r=
n X i Yi X i Yi
n X i ( X i )
2
n Yi ( Yi )
2
(6.11)
T =r
n2
1 r2
(6.12)
175
APUNTES DE ESTADISTICA
X
Y
1 2 3
2 1 3
4 5
4 3
6
5
7
6
8
7
9
5 (en $100 000)
r=
X2
Y2
XY
1
2
3
4
5
6
7
8
9
45
2
1
3
4
3
5
6
7
5
36
1
4
9
16
25
36
49
64
81
285
4
1
9
16
9
25
36
49
25
174
2
2
9
16
15
30
42
56
45
217
n X i Yi X i Yi
n X i ( X i )
n Yi ( Yi )
9(217) (45)(36)
9(285) (45) 2 9(174) (36) 2
= 0.8721
H1: 0
El estadstico de prueba es
T =r
92
n2
= 0.8721
= 4.7153
2
1 r
1 (0.8721) 2
El cual tiene una distribucin como T-student con v =n-2 = 9 2 = 7 grados de libertad.
El planteamiento de la Hiptesis conduce a una prueba de dos colas, como = 0.05 entonces
T/2,7 = 2.365
Comparando el valor crtico con el estadstico de prueba se tiene que T > T/2,7 (4.7153 >2.365).
Se rechaza Ho, s hay correlacin
Distribucion T-Student
0.4
0.35
0.3
0.25
0.2
T /2, 7= 2.365
1-
0.15
T = 4.7153
0.1
0.05
0
-5
-4
-3
-2
-1
Regin de aceptacin
Regin de rechazo
176
APUNTES DE ESTADISTICA
5. Se realiza un experimento para determinar la relacin entre la precipitacin pluvial y el rendimiento del
trigo. Supngase que se obtienen los siguientes datos.
Precipitacin pluvial en pulgadas:
Rendimiento de trigo en bushel:
X1 2 3 4 5 5 6 7 8 9
Y 1 3 2 5 5 4 7 6 9 8
a. Ajstese una recta de mnimos cuadrados a los datos con X como variable independiente y grafquese
despus la recta sobre un diagrama de dispersin.
b. Estmese el rendimiento de trigo si la precipitacin pluvial es de 10 pulg.
c. Obtngase el coeficiente de correlacin r.
d. Prubese la hiptesis nula de que no existe relacin entre la precipitacin pluvial y el rendimiento del
trigo, con = 0.05.
SOLUCION
a) La siguiente tabla muestra los clculos requeridos para determinar las sumatorias
X
1
2
3
4
5
5
6
7
8
9
50
XY
1
3
2
5
5
4
7
6
9
8
50
1
6
6
20
25
20
42
42
72
72
306
X2
1
4
9
16
25
25
36
49
64
81
310
Y2
1
9
4
25
25
16
49
36
81
64
310
m=
n X i Yi X i Yi
n X i ( X i )
X Y X X Y
b=
n X ( X )
2
i i
r=
n X i Yi X i Yi
n X i ( X i )
2
n Yi ( Yi )
2
(10)(306) (50)(50)
(10)(310) (50)2 (10)(310) (50)2
= 0.9333
177
APUNTES DE ESTADISTICA
9
8
7
6
Y
5
4
3
2
1
5
X
H1: 0
El estadstico de prueba es
T =r
10 2
n2
= 0.9333
= 7.3532
2
1 r
1 (0.9333) 2
El cual tiene una distribucin como T-student con v =n-2 = 10 2 = 8 grados de libertad.
El planteamiento de la Hiptesis conduce a una prueba de dos colas, como = 0.05 entonces
T/2,7 = 2.306
Comparando el valor crtico con el estadstico de prueba se tiene que T > T/2,8 (7.3532>2.306).
Se rechaza Ho, s hay correlacin
0.4
0.35
0.3
0.25
0.2
1-
0.15
T /2, 8= 2.306
T = 7.3532
0.1
0.05
0
-4
-2
Regin de aceptacin
Regin de rechazo
178