You are on page 1of 95

ESTADSTICA APLICADA

Mapa conceptual
ESTADSTICA
Conceptos Bsicos Poblacin

Estadstica Descriptiva

Muestra

Parmetro

Estimador

PROBABILIDAD
Conceptos Bsicos

Distribuciones de Probabilidad Discretas, Binomial, otras Distribuciones en el Muestreo

Continuas, Normal, jicuadrado, t de Student

Desigualdad de Tchebysheff, Ley de los grandes Nmeros, Teorema Central del Limite.

INFERENCIA
Estimacin Puntual Por intervalos Prueba de Hiptesis para una y dos poblaciones

Particularmente

PROCEDIMIENTO DE LA INFERENCIA ESTADSTICA 1. Conocer la poblacin, la distribucin que sigue la variable poblacional y el parmetro p a estimar La poblacin es el universo compuesto por M elementos o individuos del que se desea conocer el valor de determinado parmetro p Ejemplo: Qu porcentaje de una poblacin de M individuos consumir un nuevo producto? Si la variable aleatoria X se define como disposicin a consumir el nuevo producto, su distribucin ser Bernoulli de parmetro p desconocido 2. Determinar la aproximacin que se va a utilizar para la determinacin del parmetro poblacional a partir de la informacin muestral La muestra es la parte de la poblacin compuesta por n elementos, n<M, de la que se pretende extraer conclusiones generalizables para la poblacin, con un margen de error Ejemplo: Qu porcentaje de una poblacin de M individuos consumir un nuevo producto? Aproximacin: % de los n individuos dispuestos a consumir el producto
5

PROCEDIMIENTO DE LA INFERENCIA ESTADSTICA 3. Extraccin de la muestra aleatoria {X 1 , ..., X n } Una m.a. est compuesta por v.a. i.i.d.: a) las v.a. estn idnticamente distribuidas, lo que no implica que midan lo mismo ni que tomen lo mismos valores: F X = F X ( t ) b) las v.a son independientes, lo que implica que el valor que toma una variable es independiente del que tome otra
i

4. 5.

Obtener la muestra o datos

{x

, ..., x n }

Elegir el estadstico muestral Definicin de estadstico muestral: cualquier funcin de los elementos de la muestra (por tanto variable aleatoria) que informa sobre el parmetro a determinar Ejemplo: Qu porcentaje de una poblacin de M individuos consumir un nuevo producto? Estadstico muestral: El parmetro poblacional p es la media de la variable aleatoia poblacional X. El estadstico muestral apropiado ser la media muestral
E[X ] = p
6

PROCEDIMIENTO DE LA INFERENCIA ESTADSTICA 6. Obtencin del valor para el parmetro desconocido

Estimacin puntual Teora de la estimacin Estimacin por intervalos 7. Realizar afirmaciones sobre el valor del parmetro o sobre la distribucin poblacional susceptibles de ser refutadas Simples Paramtricas Contrastaste de hiptesis No Paramtricas
7

Compuestas

ESTADSTICOS Y DISTRIBUCIONES MUESTRALES

De la extraccin de la muestra (mtodo de muestreo) y de la eleccin del estadstico muestral depender la calidad de los resultados respecto a la aproximacin al parmetro poblacional

PROPIEDADES DEL ESTADSTICO MUESTRAL

1. 2. 3.

Es una variable aleatoria y, como tal, susceptible de cualquier medida estadstica Proviene de la muestra, con lo que slo sirve para extraer aproximaciones al verdadero valor del parmetro poblacional desconocido A mayor tamao muestral, menor incertidumbre en la aproximacin

Notacin Momentos muestrales: desconocidos, no constantes


MUESTRA ALEATORIA

1 = n

i =1

X ik

2 X, 2 n , Sn

Momentos poblacionales: desconocidos, constantes


POBLACIN

k = E X

, 2

MUESTRA

Valor estimado del momento muestral: conocidos, constantes 1 n 2 2, S k = m x ik x, n n n i =1

Relacin entre momentos muestrales y momentos poblacionales

E M k = mk 2 Var M k = n

Se espera que el k-simo momento muestral coincida con el k-simo momento poblacional La varianza del k-simo momento muestral es la varianza poblacional dividida por n
10

11

Ejercicio

12

TEORA DE LA ESTIMACIN Sea X una v.a. Cmo se determina el valor de ? Conjunto paramtrico: Estimacin puntual Estimacin por intervalos

Restringir el conjunto paramtrico


Clculo de la estimacin

Definicin de estimador (estadstico muestral)

Muestra

13

Mtodos de estimacin
MTODO DE LA MXIMA VEROSIMILTUD (MV)

El estimador se obtiene maximizando la funcin de verosimilitud L (probabilidad de observar la muestra observada para cada valor asignado al parmetro)

n P ( X = x i ) , caso discreto 1 L ( ) = i= n caso continuo fX ( xi ), i =1

El valor que maximice esta funcin (la estimacin) coincidir con aquel para el que la probabilidad de observar la muestra realmente observada sea mxima a) Caso unidimensional (un parmetro a estimar). Ya sea el caso discreto o continuo, se deber derivar la funcin L respecto al parmetro desconocido. b) Caso bidimensional (dos parmetros a estimar). Ya sea el caso discreto o continuo, se deber derivar la funcin L respecto a los dos parmetros desconocidos. Los estimadores MV son los ms usados porque basan la estimacin en la informacin muestral (funcin de verosimilitud) y porque cumplen algunas propiedades deseables
14

Procedimiento
Sea X una variable aleatoria cuya distribucin de probabilidad depende del parmetro desconocido . Sea la funcin de densidad de probabilidad de la poblacin f(x,). 1. Se toma una muestra aleatoria x1, x2, ..., xn de observaciones independientes y se calcula la densidad conjunta de la muestra: la funcin de verosimilitud y se expresa como:

L(x1,...,xn , ) = f(x1, ) f(x2 , ) ... f(xn , ) L(x1,...,xn , ) = f ( xi , )


i =1
15

Si de una poblacin cualquiera hemos obtenido una muestra particular, es razonable pensar que la muestra obtenida era la que mayor probabilidad tena de ser escogida.

Funcin mxima verosimilitud

MV

Valor del estimador mxima verosimilitud


16

Si los valores posibles de son discretos, el procedimiento es evaluar L(x,) para cada valor posible y elegir el valor de para el cual L alcanza su mximo. Por otro lado, si L(x,) es diferenciable se puede maximizar L sobre el rango de valores posibles de obtenindose condiciones de primer y segundo orden. 2. En la prctica es ms fcil maximizar el logaritmo de la funcin de verosimilitud. Como la funcin logaritmo es una transformacin montona, maximizar L(x,) es equivalente a maximizar Ln(L(x,)).

17

3. Derivamos respecto al parmetro-objetivo.

4. Igualamos a cero para encontrar el mximo de la funcin

5. Verificamos la condicin de mximo

18

Ejercicio
Supongamos que los tiempos de fallos de ciertas componentes electrnicas, X, provienen de una distribucin exponencial de parmetro . Dada una muestra de n componentes, obtenga el E.M.V. de .

19

Solucin La funcin de densidad es:

Y se dispone de los tiempos de fallo de n componentes elegidas al azar x1, x2,, xn. La funcin de verosimilitud est dada por:

20

Resolviendo la ecuacin de verosimilitud

se concluye que el EMV para por este procedimiento viene dado por

21

Ejercicio

22

Solucin

23

24

Ejercicio

25

Solucin Por el mtodo de mxima verosimilitud:

26

27

Realizada la estimacin de un parmetro cabe preguntarse:


Es exacta la estimacin? Es probable que la estimacin sea alta o baja? Con otra muestra se obtendra el mismo resultado, o bastante diferente? La calidad de un procedimiento de estimacin mejora bastante si la estadstica de la muestra es menos variable e insesgada a la vez?

28

Propiedades de los estimadores


El estimador es un estadstico muestra, y, como tal, es cualquier funcin de la muestra. Por tanto, y aunque los derivados de alguno de los mtodos de estimacin sean siempre ms apropiados, dependiendo del parmetro desconocido, la eleccin del estimador generar una mejor o peor aproximacin al verdadero valor del parmetro. De ah, la importancia de definir propiedades de los estimadores que permitan realizar la eleccin del estimador de forma ms adecuada. Un estimador ser mejor cuantas ms propiedades cumpla.

1. Insesgadez
es insesgado si E Definicin : = > Si E : b() = E (sesgo de ) ) = 0 lm E > Si lm b( = es asintticamente insesgado
n n

29

2. Eficiencia y Preferibilidad

30

Ejemplo

32

Solucin

33

34

35

3. Consistencia
P es un estimador consistente de > 0 : lmP > =0 Definicin : n m.c P es consistente > Si

lmVar es un estimador n m.c n > Si lm E = 0 ECM 0 n fuertementeconsistente lmb n

() ()

36

37

Ejemplo

Solucin

38

39

Resumen prctico Estimador = Tiro al blanco

40

41

Ejemplo

42

Solucin

43

Ejercicio

44

Solucin

45

Ejercicio

si

Obtener el valor esperado y la varianza de S2

46

Solucin
como

tenemos

47

Ejercicio La v. a. X sigue distribucin U(0, ), donde es un valor positivo y desconocido. Se extrae una m. a. s. de tamao n (n>2). Dado los estimadores siguientes de , Cules de los siguientes errores cuadrticos medios son correctos?

48

Estimacin por Intervalo

Hasta ahora los estimadores estudiados son puntuales, es decir, exhiben un valor como estimacin del parmetro de inters. En muchos casos esto no es suficiente; se requiere de un rango de posibles valores donde se cree el parmetro de inters estar con una alta confianza. Sea un parmetro de inters y un estimador puntual de . Una estimacin de por intervalos es un intervalo real de la forma:
donde l y u dependen de y de la distribucin de

Se denomina INTERVALO ALEATORIO

Para una m.a. dada el intervalo (l, u) es llamado intervalo de confianza al 100(1-)% para . l y u son llamados limites de confianza (inferior y superior respectivamente) y 1 - es llamado coeficiente de confianza. Este intervalo se conoce como IC Bilateral. pero tambin es posible calcular IC unilaterales:
a) Por su extremo o cota se clasifican en:

b) Por la regin que estiman se clasifican en:

I.C hacia la derecha I.C hacia la izquierda En un IC bilateral la longitud u - l es una medida de la calidad de la informacin obtenida. El semiintervalo - l u - se conoce como Precisin del Estimador. Lo ideal es tener IC angostos con una alta confianza.

Mtodo general para obtener intervalos de confianza


Sea X1, X2,..., Xn una m.a. de una distribucin que depende de un parmetro . Supongamos que existe una funcin (es decir, una funcin de la muestra y del parmetro denominado pivote) cuya distribucin no depende de ni de ningn otro parmetro desconocido. Entonces, existen dos valores a y b tales que:
a partir de esta expresin, es posible obtener un intervalo de confianza para .

son los lmites de confianza, y para una muestra en particular se obtiene el I. C.

Distribucin muestral del pivote pivote

usar

Ejemplo:
Una muestra aleatoria de 36 cigarrillos de una marca determinada dio un contenido promedio de nicotina de 3 miligramos. Suponga que el contenido de nicotina de estos cigarrillos sigue una distribucin normal con una desviacin estndar de 1 miligramo. a) Obtenga e interprete un intervalo de confianza del 95% para el verdadero contenido promedio de nicotina en estos cigarrillos. b) El fabricante garantiza que el contenido promedio de nicotina es de 2,9 miligramos, qu puede decirse de acuerdo con el intervalo hallado?

Solucin a)

Interpretacin: Tenemos una certeza del 95% de que el verdadero contenido promedio de nicotina se halla entre 267 y 333 miligramos

b) Como 29 se encuentra en el intervalo hallado no


podemos descartarlo como valor posible del parmetro
9

Ejemplo:

Solucin

10

Solucin

11

usar

12

Ejemplo:
El tiempo (en minutos) que tardaron 15 operarios para familiarizarse con el manejo de una mquina moderna adquirida por la empresa fue: 3.4, 2.8, 4.4, 2.5, 3.3, 4, 4.8, 2.9, 5.6, 5.2, 3.7, 3, 3.6, 2.8, 4.8. Suponga que los tiempos se distribuyen normalmente. a) Determine e interprete un intervalo del 95% de confianza para el verdadero tiempo promedio. b) El instructor considera que el tiempo promedio requerido por la poblacin de trabajadores que recibe instruccin sobre esta mquina es superior a 5 minutos, qu se puede decir de acuerdo con el intervalo hallado?

13

Solucin a)

Interpretacin: Tenemos un 95% de certeza de que el verdadero tiempo promedio que requieren los operarios para familiarizarse con la mquina est entre 326 y 434 minutos. b) La apreciacin del instructor no parece ser correcta ya que el promedio 5 minutos est fuera del intervalo hallado (aunque debera analizarse con un I.C. unilateral)
14

15

16

Ejemplo:
Se registraron los siguientes datos, en minutos, que tardan algunos hombres y mujeres en realizar cierta actividad en una empresa, los cuales fueron seleccionados aleatoriamente

Suponga que los tiempos para los dos grupos se distribuyen normalmente y que las varianzas son iguales, aunque desconocidas. a)Calcule e interprete un intervalo de confianza del 99% para la verdadera diferencia de medias. b) De acuerdo con el intervalo hallado, hay evidencia de que los dos tiempos promedio son iguales?
17

Solucin a)

Interpretacin: Tenemos una certeza del 99% de que la verdadera diferencia promedio de tiempo se encuentra entre 161 y 239 minutos.

b) Como el cero no est contenido en el intervalo, estos


datos no evidencian una igualdad entre las medias.
18

19

20

Ejercicio
10 personas fueron sometidas a un test antes y despus de recibir cierta instruccin los resultados fueron como sigue:

Proporcionan estos datos evidencia suficiente para decir que la instruccin fue efectiva? Tome un nivel de confianza del 99%.
21

22

Ejemplo:
Un ingeniero de control de la calidad midi el espesor de la pared de 25 botellas de vidrio de 2 litros. La media muestral result 4.05 m.m. y la desviacin tpica 0.08 mm. Obtn un intervalo de confianza al 90% para la variabilidad del espesor de la pared de las botellas Solucin

23

24

Ejemplo:
Se piensa que la concentracin del ingrediente activo de un detergente lquido para ropa est afectado por el tipo de catalizador utilizado en el proceso de fabricacin. Por experiencias anteriores se supone que la desviacin estndar de la concentracin activa es de 3 g/l, sin importar el tipo de catalizador utilizado. Se toman 10 observaciones con cada catalizador y se obtienen los siguientes datos:

Obtn un intervalo de confianza al 90% para el cociente de varianzas?. Puede suponerse la misma variabilidad en la concentracin con el empleo de ambos catalizadores?.

25

Solucin

26

reemplazando en el denominador del pivote p por su estimador.

Observacin
Usar

27

Intervalos de confianza unilaterales

28

Ejemplo:
Para poder controlar la fabricacin de un producto se toman 85 muestras de un determinado componente y se concluye que 10 de ellos no cumplen las especificaciones. Calcula un intervalo de confianza al 95% para la proporcin de defectuosos. Solucin

29

Ejemplo:

30

Solucin

31

Ejemplo
En Lima se toma una muestra aleatoria de 100 votantes y se encuentra que 25 de ellos estn a favor de un candidato al Congreso. En Arequipa se toma una muestra aleatoria de 100 votantes y se encuentra que 45 de ellos estn a favor del candidato. Estimar con un intervalo de 95% de confianza la diferencia de proporciones.

32

Solucin Por conveniencia especificamos:

33

Ejemplo
Un ingeniero analiza la resistencia a la compresin del concreto. De una m.a de 49 especimenes se obtuvo una resistencia promedio de 3250 psi y una desviacin estndar de 31.62 psi. Construya un I.C al 95% para la resistencia media a la compresin de este concreto.
34

Solucin Suponga que X1,,X49 es una m.a que representa las resistencias a la compresin de 49 especimenes de este concreto y suponga que E[Xi] = y V[Xi] =2 , i =1,,49. Un I. C. aproximado al 100(1-)% para es: Como 2 es desconocida, y los estadsticos son:

35

Determinacin del tamao de muestra n para estimar la media poblacional (N infinito)


E = z1-/2

es la mitad del ancho del intervalo de confianza

(producto del coeficiente y el error estndar) y se denomina error mximo de estimacin E. Dado un valor de error y un cierto nivel de confianza, podemos estimar cul sera el tamao de la muestra

n=

2 1 / 2 2

36

Ejemplo:
Se desea estudiar la variable altura de los individuos de una poblacin, considerando que sta es una variable que se distribuye de modo gaussiana. Para ello se tom una muestra de 25 individuos (que podemos considerar piloto), que ofreci los siguientes resultados:

Calcular el tamao que debera tener una muestra para que se obtuviese un intervalo de confianza para la media poblacional con un nivel de confianza al 99% y con una precisin de E=1 cm.
37

Solucin
En este caso se obtiene:

Por tanto, si queremos realizar un estudio con toda la precisin requerida en el enunciado se debera tomar una muestra de 694 individuos. Esto es una indicacin de gran utilidad antes de comenzar el estudio. Una vez que el muestreo haya sido realizado, debemos confirmar que el error para el nivel de significacin dado es inferior o igual a 1 cm, utilizando la muestra obtenida.

38

Determinacin del tamao de muestra n para estimar la media poblacional (N finito)


E= z1-/2

N n N 1

es la mitad del ancho del intervalo de

confianza (producto del coeficiente y el error estndar) por el factor de correccin para poblacin finita y se denomina error mximo de estimacin E. Dado un valor de error y un cierto nivel de confianza, podemos estimar cul sera el tamao de la muestra

n=

z12 / 2 + E 2 ( N 1)
39

2 1 / 2 2

N
2

Ejemplo:
Inters: Conocer el salario semanal promedio de trabajadores en una zona de cierto distrito de Lima (se asume que son 1800 trabajadores). El estudio queremos realizarlo mediante una muestra y necesitamos calcular el tamao de muestra n, considerando un grado de confianza del 95%. Los resultados de un estudio preliminar proporciona un promedio de 210 nuevos soles y una desviacin estndar de 30 nuevos soles semanal. Con un error relativo del 6%, obtener el tamao de n.

40

Solucin
Definicin de error relativo: Er = (E/media)*100 E = (Er*media)/100 Por consiguiente: E= (6*210)/100 = 12.6 Grado de confianza 95%, nos indica que Z=1.96. Reemplazando valores en la formula se tiene: n=[(1.96)2(30)2(1800)]/[1.962(30)2+(12.6)2(1799)] =22 Por tanto, n=22 se requiere como mnimo 22 trabajadores.

41

Determinacin del tamao de muestra n para estimar la proporcin poblacional (N infinito)


PQ E= z1-/2 es la mitad del ancho del intervalo de confianza n (producto del coeficiente y el error estndar) y se denomina error mximo de estimacin E.

Dado un valor de error y un cierto nivel de confianza, podemos estimar cul sera el tamao de la muestra

z12 / 2 PQ n= 2 E
42

Ejemplo:
Para poder controlar la fabricacin de un producto se toman 85 muestras de un determinado componente y se concluye que 10 de ellos no cumplen las especificaciones. Cul debera ser el tamao de la muestra si se quiere que el error cometido al estimar la proporcin sea menor de 0.05 con una probabilidad 0.95?. Solucin

43

44

Determinacin del tamao de muestra n para estimar la proporcin poblacional (N finito)


E = z1-/2
p q n N n N 1
es la mitad del ancho del intervalo de

confianza (producto del coeficiente y el error estndar) y se denomina error mximo de estimacin E. Dado un valor de error y un cierto nivel de confianza, podemos estimar cul sera el tamao de la muestra

z12 / 2 Np q n= 2 2 z1 / 2 p q + E ( N 1)
45

Ejemplo:

46

47

Ejercicio
Para calibrar un nuevo aparato de medida, un investigador realiz 15 mediciones, en las que obtuvo los siguientes errores: -0.10 -0.15 0.00 0.50 0.10 -0.20 -0.15 0.20 0.25 0.30 -0.45 -0.40 0.35 0.25 -0.50 Suponiendo que los errores se distribuyen segn una ley normal, (a) calcula un intervalo de confianza del error medio de medida con coeficiente de confianza 0,99. (b) Sabiendo que la desviacin tpica del error es menor o igual a 0,4, cuntas medidas sern necesarias para obtener con probabilidad 99% una estimacin del error medio de medida con un error mximo menor o igual a 0,1? (c) Suponiendo que un aparato de medida se considera admisible si la desviacin tpica de los errores de medida que produce es menor o igual que 0,3, determina si dicho aparato puede ser admisible al nivel de confianza del 99%.

48

You might also like