You are on page 1of 42

INFERENCIA ESTADÍSTICA

La Inferencia Estadística comprende los métodos


que son usados para obtener conclusiones acerca de
la población en base a una muestra tomada de ella.
Incluye los métodos de estimación de parámetros y
las pruebas de hipótesis.

P obtención de
la muestra
M
conclusiones
Inferencia para Proporciones
Cuando estamos interesados en estimar la proporción
p (o el porcentaje) de ocurrencia de un evento. Se
necesita definir una variable aleatoria X que indique el
número de veces que ocurre el evento en una muestra
de tamaño n y con probabilidad de éxito, p. Se puede
mostrar que cuando el tamaño de muestra es grande,
tal que np > 5, entonces el estadístico
Pˆ  p
Z  ~ N (0,1)
pq
x
n ˆ
p 
n
p representa la proporción es la proporción
poblacional que se desea estimar muestral.
Intervalo de confianza para la
Proporción
Intervalo de confianza (aproximado) del 100
(1-) % para la proporción poblacional p es:

 pˆ qˆ pˆ qˆ 
 pˆ  Z / 2 , pˆ  Z / 2 
 n n 

Problema de test de hipótesis:
Una empresa constructora acaba de comprar
una gran cantidad de cables con garantía de
resistencia promedio de al menos de 7000
psi. Con la finalidad de verificar esto, ha
decidido tomar una muestra de 10 cables
para verificar su resistencia. Después usará
los resultados del experimento para decidir
si acepta o no la hipótesis del fabricante de
cables, de que la media poblacional es por lo
menos de 7000 libras por pulgadas
cuadradas.
Problema de test de hipótesis
Se busca comprobar alguna información o
afirmación (conjetura) sobre la población a
partir de los datos obtenidos de una muestra.

Menos del 3% de las bombillas de un lote de 5000


duran menos de 1000 horas.
Las bombillas duran más de 1000 horas en promedio.
La resistencia media poblacional es por lo menos
de 7000 psi.
Hipótesis Estadística
Es una aseveración o conjetura con
respecto a una o más poblaciones.
Es una afirmación que se hace acerca de
un parámetro o varios parámetros
poblacional.
La verdad o falsedad de una hipótesis
estadística nunca llega a ser conocida
con certeza.
No se considera la población, sino una
muestra aleatoria.
Test de hipótesis
Se busca evidencia en los datos de la
muestra para apoyar la hipótesis o para
rechazar la hipótesis.
La aceptación o no rechazo de una
hipótesis implica que los datos no dan
suficiente evidencia para rechazarla.
El rechazo implica que la evidencia
muestral es suficiente para rechazarla.
Hipótesis Nula y Alternativa
H0: Cualquier aseveración que deseamos
probar.
Se espera que sea rechazada después de
aplicar una prueba estadística
H1: Hipótesis alternativa.
La afirmación que se espera sea aceptada
después de aplicar una prueba estadística.
Hipótesis Nula y Alternativa
H 0 :   7000 H 0 :   7000
La resistencia media poblacional es por
lo menos de 7000 libras por pulgadas
cuadradas.

H1 :   7000
La resistencia media poblacional es
menos de 7000 libras por pulgadas
cuadradas.
Tipos de Errores
Tipos de Errores
Error de tipo I:
Rechazar la hipótesis nula cuando
ésta en la realidad es verdadera.

Error de tipo II :
Aceptar la hipótesis nula cuando ésta
en la realidad es Falsa.
Nivel de significancia
  P Re chazar H 0 / H 0 es V 

Probabilidad del error tipo II

  P No rechazar H 0 / H 0 es F 

Una disminución de  provoca un


crecimiento en 
Potencia de la prueba
1- se le llama la potencia de la prueba.

Una buena prueba estadística es


aquella que tiene una potencia de
prueba alta.
¿Mejor balance entre los
errores tipo I y tipo II?

Regla general

Nivel de error tipo II = 4 veces Nivel de error tipo I

Si el nivel de error tipo I = 5% un adecuado nivel


de error tipo II es 20% (potencia = 80%)
Ejemplo
Ho : =68
H 1 :   68   68 o   68
Una media muestral que cae cercana a 68 se
consideraría como evidencia a favor de H 0
Una media muestral considerablemente
menor o mayor que 68 se consideraría
como evidencia a favor de H1
Estadístico de prueba: X
Región
crítica: x  67 x  69
Región de aceptación o no rechazo de H0 :
67  x  69

Rechazar H0 Aceptar H0 Rechazar H0

67 68 69 X
     3. 6
X ~ N  , 
 n n  36

  P X  67 /   68  P X  69 /   68
  P Z  1.67  P Z  1.67   0.0950
9.5% de todas las muestras de tamaño 36 nos
llevarán a rechazar que la media es 68.
El nivel de significancia puede reducirse
ampliando la región de aceptación o aumentando
el tamaño de la muestra.

La reducción del nivel de significancia no es


suficiente para garantizar un buen procedimiento
de prueba. Debemos ver el error tipo II.
  P 67  X  69 /   70
0.6
H1
0.5 H0
0.4

0.3

0.2

0.1

64 66 68 70 72 74

  P  5  Z  1.66 /   70  0.0485


Procedimiento de test Hipótesis
 Establecer la H0

 Elegir una hipótesis alternativa adecuada.


 Elegir un nivel de significancia .
 Seleccionar el estadístico de prueba
apropiada y establecer la región crítica.
 Calcular el valor del estadístico de prueba a
partir de la muestra.
 Rechazar H0 si la estadística de prueba
tiene un valor en la región crítica.
Procedimiento de test Hipótesis
 Establecer la H0
 Elegir una hipótesis alternativa adecuada.
 Elegir un nivel de significancia .
 Seleccionar el estadístico de prueba
.

apropiada y establecer la región crítica.


 Calcular el valor del estadístico de prueba
a partir de la muestra.
 Rechazar H0 si la estadística de prueba
tiene un valor en la región crítica.
Prueba de Hipótesis
relacionadas con la media de
una Población Normal
Varianza conocida

De una población normal con media


desconocida  y varianza conocida  2
Se desea probar la hipótesis:

H 0 :   0
Procedimiento de test Hipótesis
 Establecer la H0
 Elegir una hipótesis alternativa adecuada.
 Elegir un nivel de significancia .
 Seleccionar el estadístico de prueba
.

apropiada y establecer la región crítica.


 Calcular el valor del estadístico de prueba
a partir de la muestra.
 Rechazar H0 si la estadística de prueba
tiene un valor en la región crítica.
Elegir una hipótesis alternativa
adecuada
Contra la alternativa:

H1 :    0

H1 :    0
H1 :    0
Procedimiento de test Hipótesis
 Establecer la H0
 Elegir una hipótesis alternativa adecuada.
 Elegir un nivel de significancia .
 Seleccionar el estadístico de prueba
.

apropiada y establecer la región crítica.


 Calcular el valor del estadístico de prueba
a partir de la muestra.
 Rechazar H0 si la estadística de prueba
tiene un valor en la región crítica.
Procedimiento de test Hipótesis
 Establecer la H0
 Elegir una hipótesis alternativa adecuada.
 Elegir un nivel de significancia .
 Seleccionar el estadístico de prueba
.

apropiado y establecer la región crítica.


 Calcular el valor del estadístico de prueba
a partir de la muestra.
 Rechazar H0 si la estadística de prueba
tiene un valor en la región crítica.
Seleccionar el estadístico de prueba apropiado
.
Una muestra aleatoria de tamaño n.

X  0
Z

n
Se distribuye como una
normal estándar.

P( Z a / 2  Z  Z a / 2 )  1  

La Región crítica: |Z |>Z/2


Procedimiento de test Hipótesis
 Establecer la H0
 Elegir una hipótesis alternativa adecuada.
 Elegir un nivel de significancia .
 Seleccionar el estadístico de prueba
.

apropiada y establecer la región crítica.


 Calcular el valor del estadístico de prueba
a partir de la muestra.
 Rechazar H0 si la estadística de prueba
tiene un valor en la región crítica.
Calcular el valor del
estadístico de prueba a
partir de la muestra.

x  0
zcal 

n
Procedimiento de test Hipótesis
 Establecer la H0
 Elegir una hipótesis alternativa adecuada.
 Elegir un nivel de significancia .
 Seleccionar el estadístico de prueba
.

apropiada y establecer la región crítica.


 Calcular el valor del estadístico de prueba
a partir de la muestra.
 Rechazar H0 si la estadística de prueba
tiene un valor en la región crítica.
Rechazar H0 si la estadística
de prueba tiene un valor en la
región crítica.

Si |zcal |>Z/2
entonces se rechaza Ho
Fórmulas para prueba de
hipotesis de medias
Caso I Caso II Caso III
Ho : =0 H o : = 0 Ho : =0

H a : < 0 Ha :  0 H a :  > 0


X  o
Estadística Z 
de Prueba: 
n
Decisión:
Si Zcal < -Z Si Zcal > Z
Si |Zcal |>Z/2
entonces entonces
entonces
se rechaza Ho se rechaza Ho
se rechaza Ho
Prueba de hipotesis
(varianza desconocida)
Caso III
Caso I Caso II
Ho : =0 H o : = 0 Ho : =0

H a : < 0 Ha :  0 H a :  > 0


X  o
Estadística t con n-1 grados de libertad
de Prueba: S
n
Decisión:
Si tcal < -t Si |tcal |>t/2 Si tcal > t
entonces entonces entonces
se rechaza Ho se rechaza Ho se rechaza Ho
Comparación entre dos medias
poblacionales usando muestras
independientes
Supongamos que se tienen dos poblaciones distribuidas
normalmente con medias desconocidas 1 y 2,
respectivamente. Se puede aplicar una prueba t de
Student para comparar las medias de dichas poblaciones
basándonos en dos muestras independientes tomadas de
ellas.
Si las varianzas de las poblaciones son iguales pero
desconocidas
 12   22   2 t
( x  y )  ( 1   2 )
~ tnm2
1 1
sp 
m n
La varianza poblacional es estimada por una
varianza combinada de las varianzas de las dos
muestras tomadas.
(m  1) s  (n  1) s
2 2
s 
2
p
1 2

mn2
Un intervalo de confianza del 100(1-) % para la
diferencia 1-2 de las medias poblacionales será de
la forma:
1 1
x  y  t ( / 2,n  m  2 ) s p 
m n
Las pruebas de hipótesis son:
Caso I Caso II Caso III
Ho : 1   2 Ho :1  2 Ho : 1  2
Ha : 1   2 Ha : 1  2 Ha :1  2
Prueba Estadística:
xy
t con m+n-2 grados de libertad
1 1
sp 
m n
Decisión:
Si t cal <  t Si t cal< t / 2 o t cal > t1 / 2 Si t cal > t1
se rechaza Ho se rechaza Ho se rechaza Ho
Si las varianzas de las poblaciones no son iguales, entonces se
usa una prueba aproximada de t, donde el número de grados de
libertad es calculado aproximadamente.
La prueba de t aproximada está dada por:
xy
t
s12 s 22

m n
donde los grados de libertad gl son aproximados por la siguiente
fórmula:
(c1  c 2 )2
gl  2
c1 c 22

m 1 n 1
s12 s 2
c1  c2  2
m n
Comparando media de dos
poblaciones usando muestras
pareadas
En este caso se trata de comparar dos métodos o
tratamientos, pero se quiere que las unidades
experimentales donde se aplican los tratamientos
sean las mismas, ó lo más parecidas posibles, para
evitar influencia de otros factores en la comparación
Sea Xi el valor del tratamiento I y Yi el
valor del tratamiento II en el i-ésimo sujeto.
Consideremos di = Xi - Yi la diferencia de los
tratamientos en el i-ésimo sujeto.
Las inferencias que se hacen son acerca del
promedio poblacional d de las di . Si d = 0,
entonces significa que no hay diferencia
entre los dos tratamientos.
n
 i 
d
2
( d d )
i sd  i

d i 1 n 1
n
Pruebas de Hipótesis
Caso I Caso II Caso III
Ho : d = 0 Ho : d = 0 Ho :  d =0
Ha : d < 0 Ha : d  0 Ha : d >0

d
Prueba Estadística: t ~ t n 1
sd
n
Decisión:
Si tcalc<-t Si | tcal |>t/2 Si tcal >t
Se rechaza H0
Test de hipótesis para
Proporciones
Caso I Caso II Caso III
Ho : p=p0 Ho : p=p0 Ho : p=p0
Ha : p<p0 Ha : p  p0 Ha : p>p0
( p  p0 )
Prueba Estadística (Aproximada): Z
p0 q0
n
Decisión
Si Zcal <-Z Si |Zcal |>Z / 2 Si Zcal >Z
entonces entonces entonces
se rechaza Ho se rechaza Ho se rechaza Ho

You might also like