You are on page 1of 4

Apuntes Taller 4 de Estadı́stica y Probabilidad

Prueba de hipótesis de R
Profesoras: Ludy Núñez S. & Gisella Tapia

1. Método de Prueba de Hipótesis


El método de prueba de hipótesis paramétricas consiste en plantear afirmaciones o hipótesis acerca de los
parámetros de la población en estudio. Luego en base a los resultados obtenidos en una m.a. de la población,
se determina si tales hipótesis son correctas o incorrectas (verdaderas o falsas).
Las hipótesis que se plantean son:
H0 : hipótesis nula v/s H1 : hipótesis alternativa (opuesta a la nula)

Observación 1. Cuando las hipótesis estan asociadas a parámetros, tales como: la media, la diferencia de
medias, la desviación estándar, la razón de varianza, etc. La hipótesis nula generalmente es que el parámetro
es igual a un valor determinado, en cambio la hipótesis alternativa involucra la desigualdad (6=) o una relación
de orden ( “menor que” o “mayor que”).
La hipótesis nula se rechaza cuando p-value (valor dado por el software) es inferior al nivel de significación
propuesto en el problema o dado por el investigador.
El nivel de significación es
α = P (Rechazar H0 /H0 es verdadera)

2. Pruebas de hipótesis de R
2.1. Prueba de t-Student
Es una prueba de contraste paramétrica. Se utiliza para comprobar la igualdad de las medias de dos muestras
o una muestra (para comprobar si la media de una muestra es igual a una media teórica determinada).

2.1.1. Una muestra


Contraste Bilateral
t.test(x, mu=M edia, conf.level=1 − α), donde x es el vector que contiene las observaciones de la variable
X que suponemos distribuida en forma normal. M edia, es el valor que suponemos verdadero y 1 − α es el nivel
de confianza para determinar un intervalo para la media.
Contraste Unilateral
t.test(x, mu=M edia, alternative=“relación”), relación, corresponde a la relación de orden, que puede ser
greater (mayor) o less (menor).

2.1.2. Dos muestras independientes


Contraste Bilateral
t.test(x1,x2,conf.level=1 − α), donde x1, es el vector que contiene las observaciones de la variable X que
suponemos normal y observada en la muestra 1. x2 es el vector correspondiente a las observaciones de la variable
X en la muestra 2. Las muestras 1 y 2 provienen de poblaciones normales e independientes.
Contraste Unilateral
t.test(x1,x2,alternative=“relación”).

1
2.1.3. Dos muestras pareadas
Contraste Bilateral t.test(t1,t2, paired=TRUE), t1 vector de valores de la variable observado antes o
cuando se aplica el tratamiento 1 y t2 vector de valores de la variable observado después o cuando se aplica el
tratamiento 2.
Contraste unilateral
t.test(t1,t2, paired=TRUE,alternative=“relacióm”)

2.2. Prueba de Varianzas


Esta prueba tiene como principal objetivo verificar el supuesto de homocedasticidad (igualdad de varianzas).
var.test(x1, x2).

3. Otras funciones de R a utilizar


mean(x), determina el promedio de los elementos del vector x.

sd(x), determina la desviación estándar de los elementos del vector x.

4. Ejercicios
1. Una industria de ensambladora de Computadores, desea comprar tornillos, la caracterı́stica principal de estos
tornillos es la resistencia máxima a la rotura (en gr/mm2 ). La industria recibe ofertas de dos distribuidores
de tornillos “Torner” y “Giros”. Antes de decidir cuál tornillo comprar el departamento de control de calidad
de la industria realiza un experimento, para ello considera una m.a de 11 tornillos “Torner” y una m.a de 9
tornillos “Giros”. La resistencias máximas a la rotura obtenidas fueron las siguientes:
Torner: 10,4 12,8 11,5 10,9 13,7 13,0 12,6 11,8 15,1 14,3 13,3
Giros: 14,7 15,8 16,7 15,3 13,9 16,9 17,1 16,3 14,9
Suponiendo que la resistencia máxima a la rotura de los tornillos se distribuye en forma normal.
a. Defina la variable y las poblaciones en estudio.

X: resistencia máxima a la rotura de los tornillos, en gr/mm2 .

Polación 1: Tornillos de marca Torner. Población 2: Tornillos de marca Giros


n1 = 11, x1 = 12, 67273 s1 = 1, 433939 n2 = 9, x2 = 15, 73333 s2 = 1,106797
b. El distribuidor “Torner” asegura que la resistencia máxima promedio de sus tornillos es superior a 11
gr/mm2 . Use un nivel de significación del 2,5 %, para determinar si esta aseveración es verdadera o no.

Planteo de hipótesis

H0 : µ1 ≤ 11 v/s H1 : µ1 > 11

Estadı́stico de prueba y nivel de significación

t = 3, 8689 α = 0, 025

Decisión
p − value = 0, 001557 < 0, 025.
Entonces se rechaza H0 , con un nivel de significación inferior al 2,5 %.

Conclusión. La evidencia estadı́stica indica que la resistencia máxima promedio a la rotura de los tor-
nillos Torner es superior a 11 gr/mm2 . Por lo tanto lo aseverado por el distribuidor Torner es correcto.
Asumiendo un riesgo inferior al 2,5 %.

2
c. Use una significación del 5 %, para determinar si es factible suponer que las varianzas poblacionales son
iguales.

Planteo de hipótesis
Como s1 > s2 , entonces planteamos las siguientes hipótesis.

H0 : σ12 = σ22 v/s H1 : σ12 6= σ22

Estadı́stico de prueba y nivel de significación

F = 1, 6785 α = 0, 05

Decisión
p − value = 0, 4747 > 0, 05.
Entonces no se rechaza H0 .

Conclusión. De acuerdo a la evidencia estadı́stica es factible suponer que las varianzas poblacionales son
iguales.

d. De acuerdo a los resultados obtenidos y usando un nivel de significación del 1 %, a cuál de los distribui-
dores deberı́a comprar la industria ensambladora de computadores.

En las muestras tenemos que x1 < x2 lo que es equivalente a x1 − x2 < 0. Luego tenemos.

Hipótesis de prueba

H0 : µ1 − µ2 ≥ 0 v/s H1 : µ1 − µ2 < 0

Estadı́stico de prueba y nivel de significación

t = −5, 3849 α = 0, 01

Decisión
p − value = 0, 00002048 < 0, 01.
Entonces se rechaza H0 , con un nivel de significación del 1 %.

Conclusión. Existe evidencia estadı́stica para afirmar que la resistencia máxima promedio a la rotura de
los tornillos Giros es superior a la de los tornillos Torner. En consecuencia la industria ensambladora de
computadores deberı́a comprar los tornillos al distribuidor Giros. Asumiendo un riesgo inferior al 1 %.
2. Una empresa de investigación de mercado desea evaluar el potencial de compra de cierto producto, antes y
después que los clientes vieran un nuevo comercial de televisión, sobre el producto. Las calificaciones (entre
0 y 10) del potencial de compra del producto dada por una m.a de 12 clientes se registran en la siguiente
tabla:

Cliente 1 2 3 4 5 6 7 8 9 10 11 12
Antes 5,8 6,2 4,9 7,5 3,9 3,8 6,2 5,7 7,3 4,0 5,0 5,2
Después 6,5 7,3 6,2 7,5 4,5 5,4 6,0 7,2 8,1 4,8 5,3 5,8

a. Defina la variable y la población en estudio. Además determine las diferencias junto con el promedio y
desviación estándar muestrales.

X: Calificación del potencial de compra.


Antes 5,8 6,2 4,9 7,5 3,9 3,8 6,2 5,7 7,3 4,0 5,0 5,2
Después 6,5 7,3 6,2 7,5 4,5 5,4 6,0 7,2 8,1 4,8 5,3 5,8
diferencia −0, 7 −1,1 −1, 3 0 −0, 6 −1, 6 0, 2 −1, 5 −0, 8 −0, 8 −0, 3 −0, 6

3
n = 12, d = −0,7583333, sd = 0,558339
b. Con un nivel de significación del 5 %, usted cree que el nuevo comercial logra aumentar el potencial de
compra del producto.

Planteo de hipótesis

H0 : D ≥ 0 v/s H1 : D < 0

Estadı́stico de prueba y nivel de significación

t = −4, 7049 α = 0, 05

Decisión
p − value = 0,0003225 < 0, 05.
Entonces se rechaza H0 , con un nivle de significación inferior al 5 %.

Conclusión. Hay evidencia estadı́stica para afirmar que la calificación promedio del potencial de compra
despues de ver el nuevo comercial es superior que antes de verlo. De modo que el nuevo comercial logra
aumentar el potencial de compra del producto. Asumiendo un riesgo inferior al 5 %.

5. Script
###T a l l e r prueba de h i p ó t e s i s ###
## E j e r c i c i o 1 ##
#Datos#
x1 <− c ( 1 0 . 4 , 1 2 . 8 , 1 1 . 5 , 1 0 . 9 , 1 3 . 7 , 1 3 , 1 2 . 6 , 1 1 . 8 , 1 5 . 1 , 1 4 . 3 , 1 3 . 3 )
x2 <− c ( 1 4 . 7 , 1 5 . 8 , 1 6 . 7 , 1 5 . 3 , 1 3 . 9 , 1 6 . 9 , 1 7 . 1 , 1 6 . 3 , 1 4 . 9 )
# a)
pro1 <− mean ( x1 ) ; pro1
de1 <− sd ( x1 ) ; de1
pro2 <− mean ( x2 ) ; pro2
de2 <− sd ( x2 ) ; de2
# b ) mu1>11
t 1 <− t . t e s t ( x1 ,mu=11 , a l t e r n a t i v e =” g r e a t e r ” ) ; t 1
# c)
var <− var . t e s t ( x1 , x2 ) ; var
# d ) pro1 < pro 2
t 2 <− t . t e s t ( x1 , x2 , a l t e r n a t i v e =” l e s s ” ) ; t 2
## E j e r c i c i o 2 ##
# datos #
a <− c ( 5 . 8 , 6 . 2 , 4 . 9 , 7 . 5 , 3 . 9 , 3 . 8 , 6 . 2 , 5 . 7 , 7 . 3 , 4 , 5 , 5 . 2 )
d <− c ( 6 . 5 , 7 . 3 , 6 . 2 , 7 . 5 , 4 . 5 , 5 . 4 , 6 , 7 . 2 , 8 . 1 , 4 . 8 , 5 . 3 , 5 . 8 )
# a)
d i f <− a−d ; d i f
p r o d i f <− mean ( d i f ) ; p r o d i f
d e d i f <− sd ( d i f ) ; d e d i f
# b)
t 3 <− t . t e s t ( a , d , p a i r e d=TRUE, a l t e r n a t i v e =” l e s s ” ) ; t 3

You might also like