Taller 4

Apuntes Taller 4 de Estadı́stica y Probabilidad
Prueba de hipótesis de R
Profesoras: Ludy Núñez S. & Gisella Tapia
1. Método de Prueba de Hipótesis

El método de prueba de hipótesis paramétricas consiste en plantear afirmaciones o hipótesis acerca de los
parámetros de la población en estudio. Luego en base a los resultados obtenidos en una m.a. de la población,
se determina si tales hipótesis son correctas o incorrectas (verdaderas o falsas).
Las hipótesis que se plantean son:
H0 : hipótesis nula v/s H1 : hipótesis alternativa (opuesta a la nula)
Observación 1. Cuando las hipótesis estan asociadas a parámetros, tales como: la media, la diferencia de
medias, la desviación estándar, la razón de varianza, etc. La hipótesis nula generalmente es que el parámetro
es igual a un valor determinado, en cambio la hipótesis alternativa involucra la desigualdad (6=) o una relación
de orden ( “menor que” o “mayor que”).
La hipótesis nula se rechaza cuando p-value (valor dado por el software) es inferior al nivel de significación
propuesto en el problema o dado por el investigador.
El nivel de significación es
α = P (Rechazar H0 /H0 es verdadera)
2. Pruebas de hipótesis de R
2.1. Prueba de t-Student
Es una prueba de contraste paramétrica. Se utiliza para comprobar la igualdad de las medias de dos muestras
o una muestra (para comprobar si la media de una muestra es igual a una media teórica determinada).
2.1.1. Una muestra

Contraste Bilateral
t.test(x, mu=M edia, conf.level=1 − α), donde x es el vector que contiene las observaciones de la variable
X que suponemos distribuida en forma normal. M edia, es el valor que suponemos verdadero y 1 − α es el nivel
de confianza para determinar un intervalo para la media.
Contraste Unilateral
t.test(x, mu=M edia, alternative=“relación”), relación, corresponde a la relación de orden, que puede ser
greater (mayor) o less (menor).
2.1.2. Dos muestras independientes

Contraste Bilateral
t.test(x1,x2,conf.level=1 − α), donde x1, es el vector que contiene las observaciones de la variable X que
suponemos normal y observada en la muestra 1. x2 es el vector correspondiente a las observaciones de la variable
X en la muestra 2. Las muestras 1 y 2 provienen de poblaciones normales e independientes.
Contraste Unilateral
t.test(x1,x2,alternative=“relación”).
1
2.1.3. Dos muestras pareadas
Contraste Bilateral t.test(t1,t2, paired=TRUE), t1 vector de valores de la variable observado antes o
cuando se aplica el tratamiento 1 y t2 vector de valores de la variable observado después o cuando se aplica el
tratamiento 2.
Contraste unilateral
t.test(t1,t2, paired=TRUE,alternative=“relacióm”)
2.2. Prueba de Varianzas

Esta prueba tiene como principal objetivo verificar el supuesto de homocedasticidad (igualdad de varianzas).
var.test(x1, x2).
3. Otras funciones de R a utilizar

mean(x), determina el promedio de los elementos del vector x.
sd(x), determina la desviación estándar de los elementos del vector x.
4. Ejercicios
1. Una industria de ensambladora de Computadores, desea comprar tornillos, la caracterı́stica principal de estos
tornillos es la resistencia máxima a la rotura (en gr/mm2 ). La industria recibe ofertas de dos distribuidores
de tornillos “Torner” y “Giros”. Antes de decidir cuál tornillo comprar el departamento de control de calidad
de la industria realiza un experimento, para ello considera una m.a de 11 tornillos “Torner” y una m.a de 9
tornillos “Giros”. La resistencias máximas a la rotura obtenidas fueron las siguientes:
Torner: 10,4 12,8 11,5 10,9 13,7 13,0 12,6 11,8 15,1 14,3 13,3
Giros: 14,7 15,8 16,7 15,3 13,9 16,9 17,1 16,3 14,9
Suponiendo que la resistencia máxima a la rotura de los tornillos se distribuye en forma normal.
a. Defina la variable y las poblaciones en estudio.
X: resistencia máxima a la rotura de los tornillos, en gr/mm2 .
Polación 1: Tornillos de marca Torner. Población 2: Tornillos de marca Giros

n1 = 11, x1 = 12, 67273 s1 = 1, 433939 n2 = 9, x2 = 15, 73333 s2 = 1,106797
b. El distribuidor “Torner” asegura que la resistencia máxima promedio de sus tornillos es superior a 11
gr/mm2 . Use un nivel de significación del 2,5 %, para determinar si esta aseveración es verdadera o no.
Planteo de hipótesis
H0 : µ1 ≤ 11 v/s H1 : µ1 > 11
Estadı́stico de prueba y nivel de significación
t = 3, 8689 α = 0, 025
Decisión
p − value = 0, 001557 < 0, 025.
Entonces se rechaza H0 , con un nivel de significación inferior al 2,5 %.
Conclusión. La evidencia estadı́stica indica que la resistencia máxima promedio a la rotura de los tor-
nillos Torner es superior a 11 gr/mm2 . Por lo tanto lo aseverado por el distribuidor Torner es correcto.
Asumiendo un riesgo inferior al 2,5 %.
2
c. Use una significación del 5 %, para determinar si es factible suponer que las varianzas poblacionales son
iguales.
Como s1 > s2 , entonces planteamos las siguientes hipótesis.
H0 : σ12 = σ22 v/s H1 : σ12 6= σ22
F = 1, 6785 α = 0, 05
Decisión
p − value = 0, 4747 > 0, 05.
Entonces no se rechaza H0 .
Conclusión. De acuerdo a la evidencia estadı́stica es factible suponer que las varianzas poblacionales son
iguales.
d. De acuerdo a los resultados obtenidos y usando un nivel de significación del 1 %, a cuál de los distribui-
dores deberı́a comprar la industria ensambladora de computadores.
En las muestras tenemos que x1 < x2 lo que es equivalente a x1 − x2 < 0. Luego tenemos.
Hipótesis de prueba
H0 : µ1 − µ2 ≥ 0 v/s H1 : µ1 − µ2 < 0
t = −5, 3849 α = 0, 01
Decisión
p − value = 0, 00002048 < 0, 01.
Entonces se rechaza H0 , con un nivel de significación del 1 %.
Conclusión. Existe evidencia estadı́stica para afirmar que la resistencia máxima promedio a la rotura de
los tornillos Giros es superior a la de los tornillos Torner. En consecuencia la industria ensambladora de
computadores deberı́a comprar los tornillos al distribuidor Giros. Asumiendo un riesgo inferior al 1 %.
2. Una empresa de investigación de mercado desea evaluar el potencial de compra de cierto producto, antes y
después que los clientes vieran un nuevo comercial de televisión, sobre el producto. Las calificaciones (entre
0 y 10) del potencial de compra del producto dada por una m.a de 12 clientes se registran en la siguiente
tabla:
Cliente 1 2 3 4 5 6 7 8 9 10 11 12
Antes 5,8 6,2 4,9 7,5 3,9 3,8 6,2 5,7 7,3 4,0 5,0 5,2
Después 6,5 7,3 6,2 7,5 4,5 5,4 6,0 7,2 8,1 4,8 5,3 5,8
a. Defina la variable y la población en estudio. Además determine las diferencias junto con el promedio y
desviación estándar muestrales.
X: Calificación del potencial de compra.

Antes 5,8 6,2 4,9 7,5 3,9 3,8 6,2 5,7 7,3 4,0 5,0 5,2
Después 6,5 7,3 6,2 7,5 4,5 5,4 6,0 7,2 8,1 4,8 5,3 5,8
diferencia −0, 7 −1,1 −1, 3 0 −0, 6 −1, 6 0, 2 −1, 5 −0, 8 −0, 8 −0, 3 −0, 6
3
n = 12, d = −0,7583333, sd = 0,558339
b. Con un nivel de significación del 5 %, usted cree que el nuevo comercial logra aumentar el potencial de
compra del producto.
H0 : D ≥ 0 v/s H1 : D < 0
t = −4, 7049 α = 0, 05
Decisión
p − value = 0,0003225 < 0, 05.
Entonces se rechaza H0 , con un nivle de significación inferior al 5 %.
Conclusión. Hay evidencia estadı́stica para afirmar que la calificación promedio del potencial de compra
despues de ver el nuevo comercial es superior que antes de verlo. De modo que el nuevo comercial logra
aumentar el potencial de compra del producto. Asumiendo un riesgo inferior al 5 %.
5. Script
###T a l l e r prueba de h i p ó t e s i s ###
## E j e r c i c i o 1 ##
#Datos#
x1 <− c ( 1 0 . 4 , 1 2 . 8 , 1 1 . 5 , 1 0 . 9 , 1 3 . 7 , 1 3 , 1 2 . 6 , 1 1 . 8 , 1 5 . 1 , 1 4 . 3 , 1 3 . 3 )
x2 <− c ( 1 4 . 7 , 1 5 . 8 , 1 6 . 7 , 1 5 . 3 , 1 3 . 9 , 1 6 . 9 , 1 7 . 1 , 1 6 . 3 , 1 4 . 9 )
# a)
pro1 <− mean ( x1 ) ; pro1
de1 <− sd ( x1 ) ; de1
pro2 <− mean ( x2 ) ; pro2
de2 <− sd ( x2 ) ; de2
# b ) mu1>11
t 1 <− t . t e s t ( x1 ,mu=11 , a l t e r n a t i v e =” g r e a t e r ” ) ; t 1
# c)
var <− var . t e s t ( x1 , x2 ) ; var
# d ) pro1 < pro 2
t 2 <− t . t e s t ( x1 , x2 , a l t e r n a t i v e =” l e s s ” ) ; t 2
## E j e r c i c i o 2 ##
# datos #
a <− c ( 5 . 8 , 6 . 2 , 4 . 9 , 7 . 5 , 3 . 9 , 3 . 8 , 6 . 2 , 5 . 7 , 7 . 3 , 4 , 5 , 5 . 2 )
d <− c ( 6 . 5 , 7 . 3 , 6 . 2 , 7 . 5 , 4 . 5 , 5 . 4 , 6 , 7 . 2 , 8 . 1 , 4 . 8 , 5 . 3 , 5 . 8 )
# a)
d i f <− a−d ; d i f
p r o d i f <− mean ( d i f ) ; p r o d i f
d e d i f <− sd ( d i f ) ; d e d i f
# b)
t 3 <− t . t e s t ( a , d , p a i r e d=TRUE, a l t e r n a t i v e =” l e s s ” ) ; t 3

Taller 4

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Taller 4

Uploaded by

Copyright:

Available Formats

Apuntes Taller 4 de Estadı́stica y Probabilidad

1. Método de Prueba de Hipótesis

2.1.1. Una muestra

2.1.2. Dos muestras independientes

2.2. Prueba de Varianzas

3. Otras funciones de R a utilizar

sd(x), determina la desviación estándar de los elementos del vector x.

X: resistencia máxima a la rotura de los tornillos, en gr/mm2 .

Polación 1: Tornillos de marca Torner. Población 2: Tornillos de marca Giros

Estadı́stico de prueba y nivel de significación

H0 : σ12 = σ22 v/s H1 : σ12 6= σ22

Estadı́stico de prueba y nivel de significación

Estadı́stico de prueba y nivel de significación

X: Calificación del potencial de compra.

Estadı́stico de prueba y nivel de significación

You might also like