Professional Documents
Culture Documents
Si X e Y son dos v.a.s definidas sobre el mismo espacio de probabilidades. Su funcin de Distribucin Conjunta (f.d.c.) F se define por
F(x, y) = P(X x, Y y), < x, y < .
Para ver que F est bien definida, observe que, como X e Y son v.a.s, {w|X(w) x} y {w|Y(w) y} son eventos. Su interseccin {w|X(w) x y Y(w) y} es tambin un evento, y su probabilidad, por lo tanto, est bien definida. La f.d.c. puede usarse para calcular la probabilidad de que la pareja ordenada (X, Y) est en un rectngulo sobre el plano. Consideremos el rectngulo: R = { (x, y) | a < x b, c < y d}, donde a b y c d. Entonces P((X,Y) R) = P(a < X b, c < Y d) (1)
P(a < X
b, Y
d) = P(X
b, Y
d) - P(X
a, Y
d)
P(a < X
b, Y
c) = P(X
b, Y
c) - P(X
a, Y
c)
P(a < X
b, c < Y
d) = P(a < X
b, Y
d) - P(a < X
b, Y
c)
= [F(b, d) - F(a, d)] - [F(b, c) - F(a, c)] = F(b, d) - F(a, d) - F(b, c) + F(a, c), cumplindose (1), como lo aseguramos.
Las f.d. unidimensionales FX y FY definidas por FX(x) = P(X x) y FY(y) = P(Y y), son llamadas funciones de distribucin marginal (f.d.m.) de X e Y.
f(u,v)du dv, -
< x, y < ,
(2)
entonces f es llamada funcin de densidad de probabilidades conjunta (f.d.p.c.) (con respecto a integracin) para la f.d.c. F o el par de v.a.s X, Y.
R
Si F tiene densidad f, entonces la ecuacin (1) puede ser reescrita en trminos de f, para obtener
P(a < X b, c < Y d) =
b a d c
f(x,y) dy dx.
(3)
Usando las propiedades de integracin y la definicin de un espacio de probabilidad, puede mostrarse que la relacin
P((X, Y) A) =
A
f(x,y) dx dy.
(4)
A,
f(u,v)dv du,
f(x,y)dy,
la cual satisface:
FX (x) =
x -
fX (u)du.
f(x,y)dx.
Como en el caso unidimensional, (2) no define en forma nica a f. Podemos cambiar f en un nmero finito de puntos o an sobre un nmero finito de curvas suaves en el plano sin afectar la integral de f sobre conjuntos en el plano.
Nuevamente, como en el caso unidimensional, F determina a f en los puntos de continuidad de f. Este hecho puede obtenerse de la expresin (3). Diferenciando (2) y aplicando las reglas del clculo obtenemos
y F(x,y) =
x y
y
2
f(u,v)dv du =
x -
f(u,y)du
x y
F(x,y) = f(x,y).
(6)
Bajo algunas condiciones moderadas podemos justificar estas operaciones y mostrar que (6) se cumple en los puntos de continuidad de f. En casos especficos en lugar de checar la validez de los pasos que llevan a (6), es generalmente ms simple, mostrar que la funcin f obtenida de (6) satisface (2).
Ejemplo 1. Vamos a ilustrar las definiciones y frmulas anteriores reconsiderando el ejemplo, de un disco de radio R, en el que elegimos un punto uniformemente. Si los puntos en el plano son determinados por sus coordenadas cartesianas (x, y). Entonces el disco puede ser escrito como {(x, y)| x2+ y2 R2}. Si X e Y son las v.a.s que denotan las coordenadas aleatorias del punto elegido. Correspondiendo a la suposicin de uniformidad, supongamos que X e Y tienen f.d.p.c. f dada por
f(x, y) = 1 , R2 0 , para x 2 + y 2 d.o.f. R2
(7)
f(x,y)dxdy =
Area de A , 2 R
fX (x) =
f(x,y)dy=
- R2 -x 2
1 2 R2 -x 2 dy = , R2 R2
Esto es,
2 R2 - x 2 , si -R < x < R 2 fX (x) = R 0, d.o.f.
La densidad marginal fY(y) est dada por la misma frmula reemplazando x por y. Es decir,
2 R2 - y 2 , si -R < y < R 2 fY (y) = R 0, d.o.f.
INDEPENDENCIA
Las v.a.s X e Y son llamadas v.a.s independientes si siempre que a y c d, entonces P(a < X b, c < Y d) = P(a < X b) P(c < Y d). (8)
< x, y < .
(9)
Inversamente, (9) implica que X e Y son independientes. Pues si (9) se cumple, entonces por (1) el lado izquierdo de (8) es
F(b, d) - F(a, d) - F(b, c) + F(a, c) = FX(b)FY(d) - FX(a)FY(d) - FX(b) FY(c) + FX(a) FY(c)
En general, puede mostrarse que si X e Y son independientes y, A y B son uniones de un nmero finito o infinito contable de intervalos, entonces P(X A, Y B) = P(X A)P(Y B) o , en otras palabras, los eventos { |X( ) A} y { |Y( ) B} son eventos independientes.
Si X e Y son v.a.s con densidades marginales fX y fY. Entonces, X e Y son independientes, si y slo si, la funcin f definida por: f(x, y) = fX(x)fY(y), para - <x, y < , es la f.d.p.c. para X e Y. Esto se sigue de la definicin de independencia (F(x, y) = FX(x)FY(y), para - < x, y < ) y la frmula
FX (x)FY (y) =
x y -
Como una ilustracin de v.a.s dependientes, sean X e Y como en el Ejemplo 1. Entonces, para -R < x < R y - R < y < R,
fX (x) fY (y) = 4 R2 x 2 R2 -y2 , 2 2 R
(10)
lo cual no concuerda con la densidad conjunta de estas variables en x=0 e y=0. Puesto que (0, 0) es un punto de continuidad de las funciones definidas por (7) y (10), se sigue que X e Y son v.a.s dependientes. Esto concuerda con nuestra nocin intuitiva de dependencia, puesto que, cuando X es cercano a R, Y debe ser cercana a cero, as informacin acerca de X nos da informacin acerca de Y.
Las funciones de densidad pueden tambin ser definidas directamente, como hemos visto, en otros contextos. Una Funcin de Densidad Bidimensional (o Bivariable) f es una funcin no
negativa sobre
2,
tal que:
f(x,y)dxdy = 1 .
Correspondiendo a cualquier funcin de densidad Bivariable f, existe un espacio de probabilidad y un par de v.a.s X e Y definidas sobre tal espacio, con funcin de densidad conjunta f.
La forma ms fcil de construir funciones de densidad bidimensionales es, comenzando con dos densidades unidimensionales f1 y f2 y definir la funcin f por:
f(x, y) = f1(x). f2(y), para < x, y < . (11)
f(x,y)dxdy =
f1(x)dx
f2 (y)dy = 1
Si las v.a.s X e Y tienen como f.d.p.c. a sta f, entonces X e Y son independientes y tienen densidad marginal: fX = f1 y fY = f2, respectivamente. Como una ilustracin de (11), supongamos que f1 y f2 tienen densidad normal estndar, es decir, (0, 1). Luego, f est dada por:
1 2
x2 2
f(x, y) =
1 2
y2 2
o bien,
1 -x f(x, y) = e 2
y2 2
, con -
<x< .
(12)
En nuestro siguiente ejemplo modificaremos ligeramente, el lado derecho de (12), para obtener una funcin de densidad conjunta que corresponda al caso donde las dos v.a.s tengan densidad marginal normal, siendo estas dependientes. Ejemplo 2. Supongamos que X e Y tienen f.d.p.c. f dada por
f(x, y) = ce
x 2 xy+y 2 2
, -
<x< ,
f(x, y) = c e
1 - [(y - x/2)2 2
3x 2 ] 4
, -
<x< ,
f(x,y)dy = c e
3x 2 8
1 - (y-x/2)2 2
dy.
e-u /2du =
2 ,
Consecuentemente,
fX (x) = c 2 e
x2 -3 8
=c 2
x2 4 2 3
, -
<x< .
De donde resulta claro, que fX es la densidad de una v.a. con distribucin (0, 2) donde 2 = 4/3, por lo que
c 2 1 2 1 2 2 ( ) 3 3 2 2 .
de donde:
c= 3 4 .
Y as,
f(x, y) = 3 4 e
1 - ( x 2 xy+y 2 ) 2
< x, y < .
(13)
Los clculos, anteriormente hechos, muestran que fX es la densidad de una v.a. (0, 4/3).
En forma semejante, podemos mostrar que fY es tambin la densidad de una v.a. (0, 4/3). Dado que f(x, y) fX(x)fY(y), es claro que X e Y son v.a.s dependientes.
Sean X e Y v.a.s con densidad conjunta f, en muchos contextos, se tiene una v.a. Z definida en trminos de las v.a.s X e Y, y es necesario calcular la densidad de Z. Si Z est dada por Z = (X, Y), donde en los valores de las v.a.s X e Y es una funcin de valor real cuyo dominio contiene al producto cartesiano del rango de X y el rango de Y (Soporte del v.a. (X,Y)). Para z fija, el evento {Z z} es equivalente al evento {(X, Y) Az} donde Az es el subconjunto de R2 definido por: Az = {(x, y) R2 | (x, y) z}. As
FZ (z) = P(Z z) = P((X, Y) A Z ) =
AZ
f(x,y)dxdy.
g(u)du , -
<z< ,
entonces g es necesariamente la densidad de Z. Usaremos este mtodo para calcular las densidades de X + Y y Y/X.
Distribucin de sumas
Sea Z = X + Y. Entonces A z = {(x, y) x + y z} es realmente el semiplano por debajo de la recta x + y = z, como se muestra en la Figura 1. As,
FZ (z) =
AZ
f(x, y) dx dy =
z-x -
f(x, y) dy dx.
f(x, v-x) dv dx
z -
aqu se ha intercambiado el orden de integracin. As, la densidad de la v.a. Z = X + Y est dada por:
fX+Y (z) =
-
<z< .
(14)
En las principales aplicaciones de (14), X e Y son v.a.s independientes, por lo que (14) puede ser escrita como:
fX+Y (z) =
-
fX (x)fY (z - x) dx, -
<x< ,
(15)
(16)
El lado derecho de (15) sugiere un mtodo para obtener densidades. Dadas dos densidades unidimensionales f y g, la funcin h definida por
h(z) =
-
<x< ,
Es una funcin de densidad unidimensional, la cual es llamada la convolucin de las densidades f y g. As, la densidad de la suma de dos v.a.s independientes es la convolucin de las densidades individuales.
Ejemplo 3. Sean X y Y v.a.s independientes cada una con distribucin exponencial con parmetro . Encontrar la distribucin de la v.a. X + Y. La densidad de X est dada por fX(x) = e - xI(0, )(x). Adems Y tiene la misma densidad que X. As, fX+Y(z) = 0, para z 0 y por (16), para z > 0, se tiene que
fX+Y (z) =
=
z 0 X
f (x)fY (z-x)dx
e- z
x
z 0
e-
(z-x)
dx
z 0
dx =
ze- z .
(2, ).
Ejemplo 4.
Sean X e Y v.a.s independientes y uniformemente distribuidas sobre (0, 1). Encontrar la densidad de X + Y.
La densidad de la v.a. X est dada por fX(x) = 1 para 0 < x < 1 y fX(x) = 0 d.o.f., la densidad de Y es la misma. As, fX+Y(z) = 0 para z 0. Para z > 0 aplicamos (16).
El integrando fX(x)fY(z - x) slo toma los valores 0 1. Tomar el valor 1 si x y z son tales que 0 x 1 y 0 z - x 1.
Obsrvese que la v.a. X + Y toma valores z, tales que, 0 z 2, y que el integrando tiene valor 1 si x y z son tales que 0 x 1 y 0 z - x 1. Ntese que 0 x 1 y 0 x z z 1 x. 0 z-x 1, es equivalente a, 0 x 1 y
De forma que si 0 z 1 la proposicin dada en el prrafo anterior es equivalente a 0 x z, y si 1 < z 2 la proposicin es equivalente a z - 1 x 1 . As por (16)
Si 0 z 1 el integrando tiene valor 1 sobre el conjunto 0 cero de otra forma. Por lo tanto de (16) obtenemos que
z, y
fX+Y (z) =
z 0
fX (x)fY (z-x) dx =
z 0
(1) dx = z, para 0
z 1.
Si 1 < z 2 el integrando tiene valor 1 sobre el conjunto z - 1 cero de otra forma. As por (16)
fX+Y (z) =
1 z-1 X
1 y
f (x)fY (z-x) dx =
1 z-1
(1) dx = 2 - z, para 1 z
2.
Si 2 < z <
En resumen
z, si 0 z 1, fX+Y (z) = 2 - z, si 1< z 2, 0, d.o.f.
Tambin podemos encontrar la densidad de X + Y calculando el rea del conjunto A z = {(x, y) 0 x 1, 0 y 1 y x + y z} (ver Figura 3) y diferenciando la respuesta con respecto a z.
El Ejemplo 3 tiene una importante generalizacin, la cual se expresa en el siguiente teorema. Teorema 1. Si X e Y son v.a.s independientes, tales que, X X+Y ( 1, ) y Y ( +
2,
( 2, ). ).
Entonces
1
Demostracin: Observe que X e Y son v.a.s positivas y que sus f.d.p. estn dadas por:
1
fX (x) =
fY (y) =
e- y I(0, ) (y). ( 2)
2 -1
z 0
1 -1
(z-x)
2 -1
dx.
En la integral anterior hacemos el cambio de variable u = x/z (x = zu, con dx = z du) para obtener
e- z ( 1) ( 2 )
1+ 2
1+ 2
fX+Y (z) =
1 0
(zu)
1 -1
(z-zx)
2 -1
zdu
e( 1) ( 2 ) z
1 -1
1 + 2 -1
1 0
1 -1
(1- x)
2 -1
du
(1- x)
2 -1
du
1+ 2
( 1) (
1 + 2 -1
e-
Esto es,
fX+Y (z) = c
1+ 2
1 + 2 -1
e- z , z>0,
(17)
donde
1
c=
1 -1
(1-u)
2 -1
du . (18)
( 1) (
La constante c puede ser determinada debido a que la integral de fX+Y sobre (0, ) debe ser 1. De (17) y la definicin de la densidad gama, es claro que fX+Y debe ser la densidad ( 1 + 2, ) como se afirm.
De (17) y la definicin de la densidad gama, tambin vemos que: c = 1/ ( 1 + 2). Esto junto con (18) nos permite evaluar la integral definida que aparece en (18), en trminos de la funcin gama, esto es:
1 0
1 -1
(1 u)
2 -1
du =
( 1) ( ( 1+
) . ) 2
2
(19)
Esta frmula nos permite definir una nueva familia de densidades con dos parmetros llamada densidad Beta. As, la densidad Beta con parmetros 1 y 2, est dada por:
( 1+ f(x) = 0, )x 1 -1(1- x) ( 1) ( 2 )
2
2 -1
(20)
B( 1,
2) =
( 1) ( 2 ) , para 0 < ( 1+ 2 )
< ,
Teorema 2.
Si X e Y son v.a.s independientes con densidades normales ( 1, 12) y ( 2, 22), respectivamente. Entonces X+Y tendr la densidad normal ( 1+ 2, 12+ 22).
1
= 0. Esto es
1 2
-x 2 / 2
2 1
, para -
<x< ,
fY (y) =
2
1 2
-y 2 / 2
2 2
, para -
<y< .
fX+Y (z) =
1 x2 exp 2 2 1
(z-x)2
2 2
dx.
La evaluacin de esta integral requiere algunos clculos complicados. Una forma de proceder es trabajar en la transformacin del argumento de la funcin exponencial que aparece en el integrando, esto es:
x2
2 1
2 1
(z-x)2
2 2
=
2 1
2 1
2 2
2 )x2 - 2 1 zx + 2 1
2 1 2 1
2 2 1
2 2
2
+
2 1 2 2
2 2
x2 - 2
2 1
z x+ 2
2
z 2
2
z2
2 2
2 1 2 2
2 1
2 2
z2
2 1
+
2 1 2 2
2 2
x-
2 1 2 1
z 2
2
2 1
1 +
2 z 2 2
1 exp 2
2 1
+
2 1 2 2
2 2
x-
2 1 2 1
2 2 2
2 1
1 +
2 2
z2
dx
exp =
exp =
1 2 2
2 1 1
1 +
2
2 2
z2
-
exp -
1 2
2 1
+
2 1 2 2
2 2
x-
2 1 2 1
2 2 2
dx
1 2 2
2 1 1
1 +
2
2 2
z2
2
2 1
2 2 2
exp -
1 2
2 1
1 +
2 2
z2 , para -
<z< .
Esto es:
X+Y
0,
2 1
2 2
En general, si X
( 1, (0,
2)
e Y
( 2,
2)
Las v.a.s
X-
2)
e Y-
(0,
2)
son independientes.
(X -
1)
+ (Y -
2)
= X+Y-(
2)
tiene distribucin
(0,
2).
2,
2),
como se haba
Ejemplo 5. Si X e Y son v.a.s independientes cada una con densidad (0, 2). Encontrar la densidad de las v.a.s X + Y y X2 + Y2.
Solucin: Del Teorema 2, observamos inmediatamente que tiene la densidad (0, 2 2).
X + Y
Adems, por el Ejemplo 12 del Captulo 5, X2 y Y2, tienen ambas, la misma densidad (1/2, 1/(2 2)).
Tambin, se tiene que X2 y Y2 son independientes.
que es la densidad
Distribucin de Cocientes
Sean X e Y v.a.s con densidad conjunta f. Ahora derivaremos una frmula para la densidad de la v.a . Z = Y/X. El conjunto A z = {(x, y) y/x Si x < 0, entonces y/x Si x > 0, entonces y/x As A z = {(x, y) x < 0, y z} se muestra en la Figura 4. zx, zx. xz}. Consecuentemente
f(x,y) dx dy
Az
0 xz
f(x,y)dy dx +
xz 0 -
f(x,y)dy dx
Para simplificar la ultima integral, hacemos el cambio de variable v = y/x (y = xv, con dy = xdv) en la integral ms interna, para obtener
0 z
FY (z) =
X
xf(x,xv)dv dx
z 0 -
x f(x,xv)dv dx
z
z -
(-x)f(x,xv)dv dx +
z
xf(x,xv)dv dx
|x|f(x,xv)dv dx
<z< .
(21)
|x|f(x, xz)dx.
(22)
(23)
0,
El prximo teorema es una aplicacin directa de (23). Teorema 3. Sean X e Y v.a.s independientes con densidades y ( 2, ), respectivamente. Entonces,
f Y (z) =
X
2 -1 ( 1 ) z 2 ( 1) ( 2 ) (z 1) 1
( 1, )
, si 0 < z <
(24)
0,
d.f.o.
fX (x) =
x 1 -1e- x , si x ( 1)
fY (y) =
y 2 -1e- y , si y ( 2)
0.
As, para 0 < z < , se puede aplicar la frmula (23), esto es:
1 2
f Y (z) =
X
( 1) (
1 2
xx
1 -1
e- x (xz)
2 -1
e- xzdx
z 2 -1 ( 1) ( 2 )
2 -1
e-
(z 1)x
dx.
2 -1
e-
x(z 1)
dx
( 1 2) . 1 2 ( (z 1))
Siguindose la espresin (24), al sustituir el valor de la integral en la expresin anterior, como se haba afirmado.
1,
>0
2 -1
(z 1) -(
2)
dz
( 1) ( ( 1
) . ) 2
2
Ejemplo 6. Sean X e Y v.a.s independientes cada una con densidad (0, 2). Encontrar la densidad de la v.a. Y2 .
X2
Solucin: Las v.a.s son las mismas que las del Ejemplo 5. As, nuevamente X2 y Y2 son independientes, cada una teniendo densidad (1/2, 1/(2 2)). As, al aplicar el Teorema 3,
f Y2 (z)
X2
1 (z 1) z
, si 0 < z < .
Esto es,
f Y2 (z) =
X2
1 (z 1) z 0,
, si 0 < z <
si z
Distribucin de Productos
Sean X e Y v.a.s con densidad conjunta f. Enseguida derivaremos una frmula para la densidad de la v.a . Z = XY. El conjunto A z = {(x, y) xy z} se muestra en la Figura 4a. De donde se puede observar que, para cualquier z, con - < z < : Si x < 0, entonces xy si x > 0, entonces xy z si y slo si y z, si y slo si, y z/x, y z/x.
As A z = {(x, y) x < 0, y
z/x}. Consecuentemente
FXY (z) =
f(x,y)dy dx +
z/x 0 -
f(x,y)dy dx
Para simplificar la ultima integral, hacemos el cambio de variable u = xy (y = u/x, con dy = du/x) en las integrales ms internas, para obtener
Figura 4a
FXY (z) =
1 x
z
f(x, )du dx
x
z 0 -
1 x
z
f(x, )du dx
x
1 |x|
f(x, )du dx
x
1 |x|
f(x, )du dx
x
1 |x|
1
f(x, )du dx
x
|x|
f(x, )dx du
x
fZ (z) =
dFXY (z) = dz
Densidad Condicional
Para motivar la definicin de densidad condicional de v.a.s continuas, primero discutiremos este concepto para v.a.s discretas. Supngase que X e Y son v.a.s discretas con f.d.p.c. f. Si x es un posible valor de X, entonces
P(Y = y | X = x) = P(X = x, Y = y) f(x, y) = . P(X = x) fX (x)
fY|X (y | x) =
(25)
para fX (x)
fY|X (y | x) =
y y
fX (x)
fX (x) = 1, fX (x)
as que para tal x, f Y|X(y | x) define una f.d.p. discreta en y, conocida como la densidad condicional de Y dado que X = x. En el caso discreto la densidad condicional no contiene, realmente, conceptos nuevos. Si X es una v.a. continua, sin embargo, P(X = x) = 0, para cualquier x, de forma que P(Y = y | X = x) siempre esta indefinida. En este caso, cualquier definicin de densidad condicional, necesariamente contiene un concepto nuevo. La manera ms simple para definir la densidad condicional de una v.a. continua, es por analoga con la Frmula (25) para densidad condicional en el caso discreto.
Definicin 1. Si X e Y son v.a.s continuas con densidad conjunta f. La densidad condicional fY | X se define como:
f(x, y) , para 0 fX (x) 0, fX (x) 0. ,
fY | X (y | x) =
(26)
para fX (x)
Se sigue inmediatamente de esta definicin que, como una funcin de y, fY|X(y|x) es una densidad siempre que 0 < fX(x) < (nuevamente llamada la densidad condicional de Y dado X = x).
f (y| x)dy, si a
b.
(27)
Alternativamente, podramos intentar definir la probabilidad condicional que aparece en (27) por medio del siguiente lmite:
P(a Y b | X = x) = lim P(a
h 0
b|x-h
x + h).
(28)
lim
h 0
x-h x h x-h
1 2h
x h x-h
b a
1 2h
x h
x-h X
S,
b a
b a
f(u, y) dy,
f(x, y) dy,
denominador converge a f X(x) cuando h 0. Bajo la condicin adicional de que f X(x) 0, inducimos de (28) que:
b
P(a
b | X = x) =
f(x, y) dy fX (x) ,
Se sigue inmediatamente de la definicin de funcin de densidad condicional que: f(x, y) = fX(x) fY|X(y | x), para < x, y < . (29)
Si X e Y son independientes, se tiene f(x, y) = fX(x) fY(y), para < x, y < , (30)
por lo que
f Y|X(y | x) = fY(y), si 0 < fX(x) < y <y< . (31)
Recprocamente, si (31) se cumple, entonces se sigue de (29) que (30) se cumple y X e Y son independientes. As (31) es una condicin necesaria y suficiente para que dos v.a.s X e Y que tienen una densidad conjunta, sean independientes.
, si -
x, y
Entonces, como vimos en el Ejemplo 2, X tiene densidad (0, 4/3). As, para - < x, y <
3 -(x2 -xy y2 )/2 e fY|X (y | x) = 4 2 3 e -3x /8 2 2 1 2 e - (y-x/2) /2 .
2
En otras palabras, la densidad condicional de Y dado X = x, es la densidad (x/2, 1). Hemos comenzado con densidades conjuntas y las hemos usado para construir densidades marginales y densidades condicionales. En algunas situaciones podemos invertir esto iniciando con densidades marginales y densidades condicionales, usndolas para construir densidades conjuntas.
Ejemplo 8. Sea X U(0,1), y sea Y|X U(0,X). Encontrar la densidad conjunta de X e Y, y la densidad marginal de Y.
Solucin: Como se sabe, la densidad marginal de X est dada por:
1, para 0 x 1, fX (x) = 0, d.o.f.
Por otro lado, la densidad de Y dado que X = x es uniforme sobre (0, x), as que:
fY|X (y | x) = 1/x, para 0 y 0, d.o.f. x 1,
f(x, y)dx =
1 dx = - log y, para 0 y x
1
y 1 ,
Regla de Bayes
Por supuesto que podemos invertir los papeles de X e Y, y definir la densidad condicional de X dado Y=y, por medio de la formula
fX|Y (x|y) = f(x,y) , si 0 < fY (y) < . fY (y) (32)
f(x,y)dx =
fX (x)fY|X (y|x)dx,
Esta frmula es el anlogo para el caso continuo de la famosa regla de Bayes, ya discutida.
En este captulo hemos considerado principalmente v.a.s X e Y, las cuales son continuas. Existen casos en los que uno est interesado de manera simultnea en v.a.s discretas y v.a.s continuas, como se ver en el siguiente ejemplo.
Ejemplo 9. Supngase que el nmero de accidentes automovilsticos para un conductor durante un periodo de un ao es una variable aleatoria Y que tiene una distribucin Poisson con parmetro , donde depende del conductor. Si elegimos un conductor al azar de alguna poblacin, puede ser que vare y defina una variable aleatoria con densidad f . La densidad condicional de Y dado = es la densidad Poisson con parmetro dada por,
y
fY| (y| ) =
e, para y y! d.o.f.
0,1,2, . . . ,
0,
e Y es
0,1,2, . . . ,
En general no podemos encontrar una frmula sencilla para la densidad marginal de Y o para la densidad condicional de dado Y = y, puesto que no podemos evaluar la integral requerida. Sin embargo, podemos encontrar frmulas simples en el caso especial en el cual f tiene densidad ( , ), de modo que,
e ( ) 0,
-1 -
f ( )=
, para d.o.f.
En este caso,
fY (y) = f( , y)d = e ( )
1)
-1 y
ed y!
y-1 - (
y! ( )
d =
( y) y! ( )( 1)
La frmula de la ltima integral se obtuvo usando la Formula (34) del Captulo 5. Se deja como un ejercicio para el lector mostrar que f Y es la densidad binomial negativa con parmetros y p = (1+ ).
e 1) y! ( )( ( )y! ( y)
1)
1)
y-1
ey)
1)
dado Y = y es la densidad
Si alguien en la industria de seguros desea resolver problemas de este tipo, deber muy posiblemente, intentar aproximar la verdadera densidad f por una densidad del tipo ( , ), donde y son elegidos para hacer una aproximacin tan buena como sea posible.
Los conceptos discutidos, hasta ahora en este captulo, para dos variables aleatorias X e Y, son fcilmente extendidos a n variables aleatorias. Si X1, . . ., Xn son n variables aleatorias definidas sobre un espacio de probabilidades comn ( , A, P). Su funcin de distribucin conjunta F est definida por: F(x1, . . ., xn) = P(X1 x1, . . ., Xn xn), - <x1, . . ., xn< . La funcin de distribucin marginal, para m=1, . . ., n, est definida por
FXm (x m ) = P(Xm
m
El valor de FX (x m ) puede obtenerse de F haciendo que x1, . . ., xm-1, xm+1, . . ., xn, tiendan a + .
Una funcin no negativa f es llamada funcin de densidad conjunta (con respecto a integracin) para la funcin de distribucin conjunta F, o para las variables aleatorias X1, . . ., Xn, si
F(x1,, xn ) =
x1 -
xn -
x1 xn
(34)
f(x1,, xn ) =
x1 xn
F(x1,, xn ),
es vlida en los puntos de continuidad de F. Si (34) se cumple y A es cualquier subconjunto de considerado en clculo, entonces,
P((X1, . . ., Xn ) A) =
A
Rn del tipo
En particular,
-
(35)
bn an
f(x1,, xn )dx1 dx n .
fXm
la cual se obtiene integrando f sobre el resto de las n-1 variables. Por ejemplo,
fX2 (x 2 ) =
-
En general, las variables aleatorias X1, . . ., Xn se dicen ser independientes si siempre que am bm para m = 1, . . ., n, entonces P(a1 < X1 b1, . . ., an < Xn bn) = P(a1 < X1 b1) P(an<Xn bn).
La necesidad es clara, pero la suficiencia para n>2 requiere de un truco matemtico y no ser probada aqu. Si F tiene densidad f, entonces X1, . . ., Xn son independientes si y slo si f es tal que:
f(x1,, xn ) = fX1 (x1 ) fXn (x n ), para < x1,, x n < .
Puede definirse directamente una densidad n- dimensional como una funcin no negativa sobre n para la cual (35) se cumple.
La manera ms simple de construir densidades n-dimensionales es comenzar con n densidades unidimensionales f1, . . ., fn y definir f por f(x1, . . ., xn) = f1(x1) fn(xn), para - < x1, . . ., xn< . (36)
Si X1, . . ., Xn son variables aleatorias cuya densidad conjunta f est dada por (36), entonces X1, . . ., Xn son independientes y Xm tiene como densidad marginal a fm.
Ejemplo 10. Sean X1, . . ., Xn variables aleatorias independientes, cada una teniendo una densidad exponencial con parmetro . Encuentre la densidad conjunta de X1, . . ., Xn. La densidad de Xm est dada por
fXm (xm ) = exm
, para 0
xm d.o.f.
0,
f(x1,, xn ) =
e-
(x1 . . . xn )
0,
0,
Para calcular la densidad de la suma de n variables aleatorias independientes y para otros propsitos diferentes, necesitamos el siguiente resultado.
Teorema 4. Sean X1, . . ., Xn variables aleatorias independientes. Sea Y una variable aleatoria definida en trminos de X1, . . ., Xm, y sea Z una variable aleatoria definida en trminos de Xm+1, . . ., Xn(donde 1 m<n). Entonces Y y Z son independientes. Usando este teorema y un argumento que envuelve induccin matemtica, podemos extender los Teoremas 1 y 2 para la suma de variables aleatorias independientes, como sigue. Teorema 5. Sean X1, . . ., Xn variables aleatorias independientes tal que Xm tiene la densidad ( m, ) para m = 1, . . ., n. Entonces X1 + . . . + Xn tiene la densidad ( , ), donde = 1+ . . . + n.
Recordemos que la densidad exponencial con parmetro misma que la densidad (1, ).
es la
As, un caso especial del teorema anterior tiene el siguiente corolario: Si X1, . . ., Xn son variables aleatorias independientes, cada una teniendo densidad exponencial con parmetro , entonces X1 + . . . + Xn tiene densidad (n, ). Teorema 6. Sean X1, . . ., Xn variables aleatorias independientes tal que Xm tiene densidad ( m, m2), m = 1, . . ., n. Entonces X1 + . . . + Xn tiene la densidad ( , 2), donde = 1+ . . .+ n y 2 = 12 + . . . + n2.
Si X1, . . ., Xn son variables aleatorias con densidad conjunta f, entonces cualquier sub-coleccin de estas variables aleatorias tiene una densidad conjunta la cual puede encontrarse integrando sobre el resto de las variables. Por ejemplo, si 1 m<n,
fX1,,Xm (x1,,xm ) = f(x1,, xn )dxm 1 dxn.
La densidad condicional de una sub-coleccin de X1, . . ., Xn dadas las variables que restan puede tambin ser definida en una manera obvia. As, la densidad condicional de Xm+1, . . ., Xn dadas X1, . . ., Xm est definida por
fXm 1 . . .
Xn |X1, . . ., Xm (x m 1, . . ., x n |x1, . . ., x m )
Frecuentemente las densidades condicionales son expresadas en trminos de una notacin algo diferente. Por ejemplo, sean X1, . . ., Xn, e Y, n+1 variables aleatorias con densidad conjunta f. Entonces la densidad condicional de Y dadas X1, . . ., Xn se define por
fY|X1 . . .
Xm (y | x1, . . ., x m )
(x1, , x n )dx 1, , dx n , A
T:A
B, donde
n, cuya transformacin
x1 = w1 (y1 ,y 2 , ,yn ) x2 = w2 (y1 ,y 2 , ,yn ) xn = wn (y1 ,y 2 , ,yn )
TEOREMA: Si las primeras derivadas parciales de las funciones inversas existen y son continuas, y si el jacobiano J de la transformacin inversa no es igual a cero para todo punto de B entonces
[ 1(y1, , yn ), ,
en donde,
x1 y1 J= x2 y1 xn y1
x1 y2 x2 y2 xn y2
x1 yn x2 yn xn yn
1 0
x1 0
(x1
x2 )dx2 dx1
en este caso, es claro que A = {(x1, X2)| 0 < X2 < X1 < 1}; y considrese la transformacin:
T:A B, donde y1 = x1 + x2 y2 = x1 - x2 , con B = T(A).
con jacobiano
J 1 1 2 2 1 1 2 2 1 2
Ahora, como A = {(x1, X2)| 0 < X2 < X1 < 1}, entonces se tiene que
0 <
(1)
y1 2
y2
(2)
y1 2
y2
1
(3)
De donde: (1) y2 < y1; 0 < y2 < 2 y1, de aqu que 0 que (ver figuras 1 y 2)
B = {(y1, y2)| 0
y1
2 & 0 < y2
min{y1, 2 y1} }.
y1 2
y2
y1 2
2 1
y2
1 )dy 2dy1 2
2 1
2 - y1 0 1
y1 +y 2 2
2
y1 2 =
1
y2 1 . 2
)-
1 dy 2dy1 2
y1 dy 2dy1 2
2 - y1 0
3 2 3 y1 y1 y1 y1 dy 2dy1 = + 2 6 0 2 6
Ejercicio 1: Con respecto al ejemplo anterior, supngase que ahora se tiene la transformacin: y1 = x1 + x2 y2 = x1 2x2 Hallar la integral correspondiente a esta transformacin (o cambio de variable).
APLICACIN DEL TEOREMA DE LA TRANSFORMACIN (O CAMBIO DE VARIABLE) A TRANSFORMACIONES DE VARIABLES ALEATORIAS (v.a.'s).
Sea X = (X1, . . ., Xn) un v.a. continuo de dimensin n con densidad fx(x) y sea A* el conjunto de n donde fX(x) > 0. Supngase que Y1 = u1(X1, . . ., Xn) Y2 = u2(X1, . . ., Xn)
. . .
Yn = un(X1, . . ., Xn) Donde las v.a.'s Yi son funciones de las v.a.'s Xi, tal que, yi = ui(x1, . . ., xn) para i = 1, . . ., n definen una transformacin uno a uno y sobre de A* en B* n con inversa xi = wi(y1, . . ., yn) para i = 1, . . ., n, y con jacobiano J de la transformacin inversa no idnticamente cero.
Sea A
y por el T. C. V.
(*) = fX1 , . . ., Xn (w1 (y1 , , yn ), ,wn (y1 , , y n )) J dy 1 , , dyn .
B
Sea D
n entonces,
P(Y D) = P(Y =
D B*
D B*c ) (y) dy
donde
(y) fX1, . . ., XN (w1(y1, , yn ), ,wn (y1, , yn )) J
Teorema 2: (Teorema de Transformacin) Sea X = (X1, . . ., Xn) un v.a. continuo de dimensin n con f.d.p.c. fx(x) y sea A* el conjunto de Rn donde fX(x) > 0. Si el sistema de v.a.s Yi = ui(X1, . . ., Xn), para i = 1, ,n, determina una transformacin biyectiva T de A* en B*=T(A*), cuya inversa T-1 de B* en A* est dada por xi = wi(y1,,yn), para i = 1,,n con jacobiano J no idnticamente nulo. Entonces, la f.d.p.c. del v.a. Y = (Y1,,Yn) est dada por:
fY1, . . ., Yn (y1,, yn ) fX1, . . ., Xn (w1(y1,, yn ), ,wn (y1,, yn )) J , si (y1,,yn ) 0, de otro modo B*
Ejemplo 2: Sean X1, X2 y X3 v.a.s con f.d.p.c. Conocida y sea Y1 = u1(X1, X2, X3). Se desea encontrar la densidad de Y1. Solucin: A veces es posible definir a nuevas v.a.s Y2 = u2(X1, X2, X3) e Y3 = u3(X1, X2, X3) tal que la transformacin determinada por tales v.a.s es biyectiva, de forma que aplicando el Teorema 2 se puede encontrar la f.d.p.c. del v.a. Y = (Y1, Y2, Y3) e integrar respecto a y2 e y3 para obtener la f.d.p. de la v.a. Y1.
Ejemplo 3: Sean X1, X2 una m.a. de la distribucin E(1). Hallar la f.d.p. de la v.a. Y1 = X1 + X2.
Solucin: Para aplicar el teorema de la transformacin, se propone el siguiente sistema de v.a.s: Y1 = X1 + X2 & Y2 = X1; el cual determina la siguiente transformacin:
T:
B, donde
y1 = x1+ x 2 y 2 = x1
, con B = T(
).
0 J= 1
1 1
-1, es decir, J = 1.
Ahora, como x1 = y2 >0, es decir, y2 >0; adems x2 = y1 y2 >0 de donde, y2 < y1. Luego, al considerar las desigualdades anteriores tenemos que: 0<y2<y1, esto es, B = {(y1,y2) + + | 0<y2<y1}.
Esto es,
fY1,Y2 (y1, y2 ) e-y1 , si 0<y2 <y1 0, d.o.f
De aqu que,
fY1 (y1 )
y1 0
-y1
dy 2 = e
-y1
y1 0
O bien,
fY1 (y1 ) =
Esto es, Y1
Ejemplo 3: Sean X1, . . . , Xn v.a.s independientes cada una teniendo una densidad exponencial con parmetro . Defina Y1, ,Yn por Yi = X1+ +Xi, para 1 i n. Encontrar la densidad conjunta de Y1, . . . ,Yn. Solucin: Para aplicar el teorema de la transformacin, se tiene el siguiente sistema de v.a.s: Y1 = X1, Y2 = X1 + X2, , Yi = X1+ +Xi, para 1 i n; el cual determina la siguiente transformacin:
y1 = x1 T:
n
B, donde
y 2 = x1 + x 2 y 2 = x1 + x 2 + + x n
, con B = T( n ).
Ahora, como x1 = y1 > 0, es decir, y1 >0; x2 = y2 y1 >0, de donde, y1 < y2. En general, xi = yi yi-1 > 0, esto es, yi-1 < yi, para i = 1,,n. Luego, al considerar las desigualdades anteriores tenemos que:
B = {(y1,y2) + + | 0<y1<y2<<yn}.
e-
y1
e-
(y 2 - y1 )
e-
(yn - yn-1 )
n - yn
fY1,, Yn (y1,, yn ) =
e-
yn
, para 0 d.o.f.
y1 yn ,
0,
=
y1
dy n dy n-1 dy 2
n 1 y1
yn-2 yn-1
e-
yn
dy n dy n-1 dy 2
n 1 y1
yn-2
e-
yn-1
dy n-1 dy n-2 dy 2
ey1
y2
dy 2 =
e-
y1
= e-
y1
Esto es,
Estadsticas de Orden
Sean U1, . . ., Un variables aleatorias continuas e independientes, cada una con funcin de distribucin F y funcin de densidad f. Sean X 1, . . ., X n las variables aleatorias obtenidas al tomar X 1( ), . . ., X n( ) como el conjunto U1( ), . . ., Un( ) permutado y puesto en orden creciente. En particular, X 1 y X n son definidas como las funciones:
Se sigue de las suposiciones sobre U1, . . ., Un qu, las Ui son distintas con probabilidad uno, por lo que X 1< X 2< . . . < Xn.
Para ilustrar esta definicin numricamente, supngase que U1( )=4.8, U2( )=3.5, y U3( )=4.3. Entonces X 1( )=3.5, X 2( )=4.3, X 3( )=4.8 y R( )=1.3.
Ejemplo 11. Considrese que una mquina tiene n partes cuyos tiempos de falla son, respectivamente U1, . . ., Un. Supngase tambin que dichos tiempos de falla son independientes y tienen la misma distribucin. Sea X k el tiempo que tardan en fallar k de las partes. Si la maquina falla en cuanto falla una parte, entonces X1 = min(U1, . . ., Un) es el tiempo de falla de la mquina. Si la maquina falla hasta que su ltima componente falla, entonces X n = max(U1, . . ., Un) es el tiempo de falla de la mquina.
Ejemplo 12. Si n componentes con idntica esperanza son manufacturados en una corrida particular de una lnea de ensamble y si U1, . . ., Un denotan las longitudes de las n partes. Un inspector puede estar interesado en la longitud mnima X 1 y mxima X n para verificar si las longitudes estn dentro de ciertos lmites de tolerancia. Si las componentes son intercambiables, la cantidad de variacin en las longitudes puede mantenerse pequea. Una posible medida de esta variacin es el rango R de las longitudes.
Ahora calcularemos la funcin de distribucin de la k- sima estadstica de orden X k. Si x < . La probabilidad de que caigan exactamente j elementos Ui en el intervalo (- , x] y (n-j) elementos caigan en el intervalo (x, ) es:
n j F (x)(1 - F(x))n-j , j
debido a que es aplicable la distribucin binomial con parmetros n y p=F(x). El evento {X k x} ocurre si y slo si k ms de las Ui caen en el intervalo (- , x]. As,
n
x) =
j k
n j F (x)(1 - F(x))n-j , j
<x< .
(37)
Para encontrar las correspondientes funciones de densidad, debemos diferenciar estas cantidades. Encontrando fcilmente que
fXn (x) = nFn -1(x)f(x), para < x < , y fX1 (x) = n(1 - F(x))n -1f(x), para <x< .
fXk (x) =
j
n-1 j
=
j
n j
Para encontrar la densidad del rango R primero encontramos la densidad conjunta de X 1 y X n. Suponemos que n 2 (puesto que R = 0 cuando n = 1). Si x y, entonces
P(X1 > x, Xn y) = P(x < U1 y, . . ., x < Un y) = (F(y) F(x)) n,
y) = Fn(y). Consecuentemente
x, Xn y) - P(X1 y) = P(X1< , X n x, X n y) y) - P(X1 x, Xn y)
fX 1, X n (x,y) =
x y
y.
Ahora, aplicando un argumento semejante al aplicado en la obtencin de la densidad de una suma, la densidad de R = X n X 1 est dada por
fR (r) =
-
fX 1, X n (x, r
x)dx.
En otras palabras
n(n - 1) 0, (F(r si r x)- F(x))n - 2 f(x)f(r 0. x) dx, si r 0
fR (r) =
Existe una forma heurstica , la cual es muy til, para derivar estas frmulas. Ilustramos esta forma de derivacin, reeditando la frmula para fX k . Supngase que dx denota un nmero positivo pequeo. tenemos la aproximacin
fXk (x)dx P(x Xk x+dx).
Entonces
El evento {x X k x + dx} ocurrir si k 1 de los Ui toman sus valores en (- , x], uno de los Ui toma su valor en (x, x + dx], y n k de los Ui toman sus valores en (x + dx, ) (ver Figura 5).
Aplicando la distribucin multinomial con la probabilidad de que el nmero indicado de las Ui tomen sus valores en los intervalos apropiados, se tiene que
n! fX k (x)dx (k-1)!1!(n-k)!
x k-1 x dx x n-k
f(u)du
f(u)du
x dx
f(u)du
Distribuciones Mustrales
Sean X 1, . . ., X n variables aleatorias independientes, cada una con densidad normal (0, 2). En esta seccin encontraremos las funciones de distribucin de varias variables aleatorias definidas en trminos de las variables Xi. Junto con esto damos aplicaciones del material precedente, estas funciones de distribucin son de fundamental importancia en inferencia estadstica. La constante 2 es conveniente pero no esencial puesto que X1/ , . . ., Xn/ son independientes y cada una de ellas tiene la distribucin normal estndar. As, siempre podremos tomar 2 = 1, sin prdida de generalidad.
Por el Teorema 6 la variable aleatoria X 1 + X 2 + . . . + X n tiene una distribucin normal con media 0 y varianza n 2. Si dividimos esta suma por diferentes constantes podemos obtener formas alternativas de este resultado.
As, (1/n)(X1++Xn)
(0,
2/n),
y
Xn )
n(X1
...
(0,1)
Puesto que X1/ tiene densidad normal estndar, siguindose que X 12/ 2 tiene la densidad gama (1/2, 1/2). As, por el Teorema 5, (X12 + . . . + Xn2)/ 2 (n/2, 1/2). Esta densidad gama particular es muy importante en estadstica. Y se sabe que la variable aleatoria correspondiente tiene una distribucin Jicuadrado ( 2) con n grados de libertad, denotada por 2(n). Aplicando el Teorema 5, obtenemos el siguiente resultado acerca de la distribucin 2.
Teorema 7. Sean Y1, . . ., Yn variables aleatorias independientes, tales que, Ym tiene la distribucin
2 km
. Entonces Y1 + + Yn
tiene la distribucin
(k),
donde k = k 1 + . . . + k n.
Demostracin: Por suposicin Ym (km/2, 1/2). As, por el Teorema 5, Y1+ +Yn (k/2, 1/2) donde k = k 1+ ... + k n. Pero esta distribucin es 2(k), por definicin. Tambin podemos aplicar el Teorema 3 para encontrar la distribucin de la razn de dos variables aleatorias independientes Y1, Y2 con 2(k ) y 2(k ) respectivamente. distribucin Es tradicional en 1 2 estadstica expresar el resultado en trminos de las variables Y /k normalizadas Y1/k1 y Y2/k 2. La distribucin de la variable aleatoria Y /k
1 1 2
1
es conocida como la distribucin F con k 1 y k 2 grados de libertad, y denotada por F(k 1, k 2) o por Fkk .
2
Demostracin: Por el Teorema 3, la variable aleatoria Y1/Y2 tiene densidad g, donde g est dada por (24) con 1 = k1/2 y 2 = k2/2. As, la densidad f de k2Y1/k1Y2, est dada por
k1 k1x f(x) = g( ) k2 k2
Se puede aplicar este resultado a las variables aleatorias X1, . . ., X n definidas al principio de esta seccin. Si 1 m < n, por el Teorema 4, las variables aleatorias:
X12 Xm2
2
, y
X2m
Xn2
2
son independientes y puesto que ellas tienen las distribuciones 2(n m) respectivamente, se tiene que la variable aleatoria
(X12 Xm2 )/m m F n-m (X 2m 1 Xn2 )/(n-m)
2(m)
Xn )/(n-1)
2
Puesto que X1 tiene una funcin de densidad simtrica y es independiente de la variable aleatoria (X22 Xn2 )/(n-1) se sigue fcilmente por el Teorema 2 del Captulo 5 que Y tiene una funcin de densidad simtrica fY.
Puesto que Y2 tiene densidad F(1, n 1) dada por (39) con k 1 = 1 y k 2 = n-1, encontramos que
|y|(1/k) [(k 1)/2](y 2 /k)-1/2 fY (y) = . 2 (k 1)/2 (1/2) (k/2)[1 (y /k)]
Puesto que
1 = 2
, -
(40)
Una variable aleatoria cuya densidad est dada por (40) se dice tener una distribucin t con k grados de libertad. Observemos que la distribucin t con 1 grado de libertad es la misma que la distribucin de Cauchy. La distribucin de la variable aleatoria:
Y (X2 X1
2
Xn )/(n-1)
2
la cual tiene una distribucin t con n1 grados de libertad, depende slo del hecho de que
X1 y X2
2
Xn
2
son independientes y distribuidas como (0, 1) y respectivamente. De donde se tiene el siguiente resultado:
(n-1),
Teorema 9. Si X e Y son variables aleatorias independientes con 2 , respectivamente. distribuciones (0,1) y (k) Entonces, la v.a
T= X Y/k
tiene una distribucin t con k grados de libertad. Observacin: Para indicar que la v.a. T tiene una distribucin t con k grados de libertad, usamos la siguiente notacin:
T t(k)