Professional Documents
Culture Documents
Tema 3:
Inferencia estadística
- Estimar parámetros desconocidos
- Realizar Pruebas de hipótesis
Supuestos
Ideas básicas
Muestreo Inferencias
aleatorio
ESTIMACIONES
_
X S2
Valores concretos
Ejemplo: distribución de tallas de neonatos
Valores desconocidos de los
2 Estimadores
X i
xi n 1
n
Muestra
46;48;51;52;52
46 49 51 52 52 Estimación puntual de
x 50
5
s2
46 50 2
....... 52 50
2
6,5
Estimación puntual de
5 1 2
Intervalos de confianza bilaterales:
Dada una variable aleatoria X con media
y desviación estándar ,
el teorema del límite central afirma que posee una distribución
normal estándar si X :
- se encuentra distribuida normalmente,
- no se encuentra distribuida normalmente y n sea
suficientemente grande
x
Z
n
Para una variable normal estándar, 95% de las observaciones se ubican
entre -1,96 y +1,96.
En otras palabras, la probabilidad de que Z tome un valor entre -1,96 y
+1,96 es:
x
P 1,96 1,96 0,95
/ n
Multiplicamos los tres términos de la
desigualdad por el error estándar
n
Por tanto,
P 1,96 x 1,96 0,95
n n
Restamos la media de cada término de tal manera
que:
P 1,96 x 1,96 x 0,95
n n
P x1,96 x 1,96 0,95
n n
La x ya no se localiza en el centro de la
desigualdad; en lugar de eso, la afirmación de
probabilística indica algo sobre
Intervalos de Confianza
Importante:
Cuando las muestras aleatorias son cada
vez más grandes, la variabilidad de X se
torna más pequeña.
También la variabilidad inherente de la
población estudiada, medida por , siempre
se encuentra presente.
Intervalos de Confianza
Ejemplo :
Distribución de los niveles de colesterol en
sangre de todos los varones que son
hipertensos y que fuman.
Esta distribución es:
aproximadamente normal,
con una media desconocida: = ?,
y una desviación estándar
= 46 mg / 100 ml.
Intervalos de Confianza
Interesa calcular el nivel medio de colesterol en
sangre. Antes de elegir una muestra aleatoria, la
probabilidad de que el intervalo
46 46
( X 1 .96 , X 1 .96 )
n n)
contenga la verdadera media poblacional es de
= 0,95.
Intervalos de Confianza
En el caso de tomar una muestra tamaño 12 de la
población de fumadores hipertensos y que además
poseen un nivel medio de colesterol en sangre de
x = 217 mg / 100 ml.
El intervalo de confianza de 95% para es
46 46
( 217 1 . 96 , 217 1 . 96 )
12 12
o
( 191 , 243 )
Intervalos de Confianza
Este intervalo contiene el valor de 211 mg /100 ml,
el nivel medio de colesterol en la sangre de todos
los hombres de 20 a 74 años de edad sin importar
si son hipertensos o fumadores.
Interpretación 1
Intervalos de Confianza
Interpretación 2: en términos de frecuencia.
2.58(46)
10
10
n 140.8
Intervalos de Confianza
Se necesita una muestra de 141 hombres para
reducir la amplitud del intervalo de confianza de
99% a 20 mg/100 ml.
Aunque la media de muestreo de 217 mg/100 ml
se ubica en el centro del intervalo, no desempeña
ningún papel en la determinación de su amplitud;
la amplitud es función de , n y el nivel de
confianza.
Intervalos de Confianza
EJEMPLO - Intervalo de confianza para una
proporción de Población
33
EJEMPLO - Intervalo de confianza para una
proporción de Población
34
EJEMPLO - Intervalo de confianza para una
proporción de Población
35
¿Qué es Hipótesis?
46
¿Qué es la Prueba de Hipótesis?
47
Pasos para la Prueba de Hipótesis
1) Establecer la hipótesis nula y hipótesis alternativa adecuadas.
48
Prueba de Hipótesis
49
Prueba de Hipótesis
50
Cómo hacer de una afirmación una Hipótesis
51
Prueba de Hipótesis - ¿Mayor que o menor
que?
52
Prueba de Hipótesis –
¿Mayor que o menor que? Palabras Clave Signo Parte de:
53
Partes de una Distribución en una Prueba
de Hipótesis
54
Pruebas Unilateral y Bilateral
55
Prueba de Hipótesis para la Media ()
H0: μ ≤ valor
H1: μ > valor
Rechazar H0 si:
x x
t Z > Zα z
s t > t α, n-1
n n
56
EJEMPLO - Prueba para una Media con
desviación estándar conocida
57
EJEMPLO - Prueba para una Media con
desviación estándar conocida
58
EJEMPLO - Prueba para una Media con
desviación estándar conocida
X
Z
/ n
/2
203 . 5 200
Z . 01 / 2
16 / 50
1 . 55 2 . 58
59
EJEMPLO - Prueba para una Media con
desviación estándar conocida
60
EJEMPLO (2)- Prueba para una Media con
desviación estándar conocida
61
EJEMPLO (2)- Prueba para una Media con
desviación estándar conocida
62
EJEMPLO (2)- Prueba para una Media con
desviación estándar conocida
63
EJEMPLO (2)- Prueba para una Media con
desviación estándar conocida
64
Prueba para una Media con desviación
estándar desconocida
65
EJEMPLO - Prueba para una Media con
desviación estándar desconocida
66
EJEMPLO - Prueba para una Media con
desviación estándar desconocida
67
EJEMPLO - Prueba para una Media con
desviación estándar desconocida
68
EJEMPLO - Prueba para una Media con
desviación estándar desconocida
X
t ,n 1
s / n
$ 56 . 42 $ 60
t 0 . 01 , 26 1
$ 10 . 04
26
1 . 818 2 . 485
69
EJEMPLO - Prueba para una Media con
desviación estándar desconocida
70
EJEMPLO (2)- Prueba para una Media con
desviación estándar desconocida
En un laboratorio de BAYER, la tasa actual para
producir píldoras anticonceptivas es de 250 por hora.
Se adquirió una nueva máquina, que según el
proveedor, incrementará la tasa de producción.
Una muestra de 10 horas seleccionada al azar desde
el mes pasado reveló que la media de la producción
en la nueva máquina fue de 256 unidades, con una
desviación estándar de la muestra de 6 por hora.
Con un nivel de significación de 0.05, entonces, ¿Se
puede concluir que la nueva máquina es más rápida?
71
EJEMPLO (2)- Prueba para una Media con
desviación estándar desconocida
72
EJEMPLO (2)- Prueba para una Media con
desviación estándar desconocida
73
EJEMPLO (2)- Prueba para una Media con
desviación estándar desconocida
74
Pruebas de Hipótesis para una Proporción
Una proporción es porcentaje que indica la parte de la
muestra con un rasgo particular de interés.
La proporción de la muestra se encuentra dividiendo x/n
La fórmula del estadístico es:
p
z
(1 )
n
donde :
π es la proporción de la población
p es la proporción de la población hipotética
n es el tamaño de la muestra
75
Pruebas de Hipótesis para una Proporción
76
Pruebas de Hipótesis para una Proporción
77
Prueba de Hipótesis para una Proporción ()
H0: π ≤ valor
H1: π > valor
Rechazar H0 si:
Z > Zα
78
EJEMPLO - Pruebas de Hipótesis para una
Proporción
79
EJEMPLO - Pruebas de Hipótesis para una
Proporción
80
EJEMPLO - Pruebas de Hipótesis para una
Proporción
81
EJEMPLO - Pruebas de Hipótesis para una
Proporción
82
Tipos de error en la Prueba de Hipótesis
Error de tipo I :
- Se define como la probabilidad de rechazar la
hipótesis nula cuando en realidad es cierta.
- Se denota por la letra griega "”.
- También conocido como el nivel de significación
de una prueba.
83
Tipos de error en la Prueba de Hipótesis
DECISIÓN
84
El Valor p en una Prueba de Hipótesis
85
EJEMPLO - El Valor p en la Prueba de Hipótesis
Conclusión: No se rechazará H0
86
Intervalo de Confianza para la Media –
Ejemplo usando la distribución t
87
Tabla de Distribución t
Datos :
n 10
x 0 . 32 Dado que es desconocid a
s 0 . 09 calule el I . de C. con la
distribuci ón t
s
X t / 2,n 1
n
0.09
0.32 t.05 / 2,10 1
10
0.09
0.32 2.262
10
0.32 0.064 (0.256,0.384)
88
Tabla de Distribución t
90
Intervalos de Confianza para la Media
Calcule el intervalo de confianza
con la distribuci ón t
s
X t / 2 , n 1
n
s 9 . 01
X t 0 . 05 / 2 , 20 1 49 . 35 t 0 . 025 ,19
n 20
9 . 01
49 . 35 2 . 093 49 . 35 4 . 22
20
Los extremos del intervalo de confianza
son $45.13 y $53.57
• Solution
H0: 1 = 2= 3
H1: At least two means differ
25
x 3 20
x 3 20
20 20
19
x 2 15
16 x 2 15
15
14
x1 10 12
11 x1 10
10 10
9 9
k
SST n j ( x j x) 2
j 1
Solution – continued
Calculate SST
SST SSE
MST MSE
k 1 nk
57 , 512 . 23 509,983.50
31 60 3
28 , 756 . 12 8,894.45
Calculation of the test statistic
MST
F
MSE
28 , 756 . 12
8 ,894 . 45
Required Conditions: 3 . 23
1. The populations tested
are normally distributed.
2. The variances of all the with the following degrees of freedom:
populations tested are v1=k -1 and v2=n-k
equal.
The F test rejection region
H0: 1 = 2 = …=k
H1: At least two means differ
MST
Test statistic:F
MSE
R.R: F>F,k-1,n-k
The F test
Ho: 1 = 2= 3
H1: At least two means differ
0.1
0.08
0.06
0.04 p Value = P(F>3.23) = .0467
0.02
0
-0.02 0 1 2 3 4
Contrastes no paramétricos
Los contrastes no paramétricos hacen referencia a la
distribución poblacional en su conjunto y no a ciertas
hipótesis sobre los valores de parámetros poblacionales :
Número de accidentes 0 1 2 3 4 5 6 7
Número de días 22 53 58 39 20 5 2 1
Número de accidentes 0 1 2 3 4 5 6 7
Número de días 22 53 58 39 20 5 2 1
Número de accidentes 0 1 2 3 4 5
Número de días 22 53 58 39 20 8
Realizaremos el test de constraste utilizando
Frecuencias
el estadístico chi-cuadrado siguiente: muestrales
2
k
n Eˆ
i i
2
i 1 Eˆ i Frecuencias
esperadas
6 ˆ
(ni Ei ) 2
(22 27.06) 2
(8 10.54) 2
2
... 2.307
i 1 Eˆ i 27.06 10.54
Nuestro estimador chi-cuadrado es: 2 2.307
0.05 2
5, 0.05 11.07
2
5, 0.05 11.07