You are on page 1of 75

Para comenzar el trabajo con las pruebas de hipótesis paramétricas

debes recordar algunos concepto, como los que se tratar a


continuación:

La estadística inferencial tiene como propósito describir el estado de


una población determinada usando la información que brinda una
muestra representativa de dicha población.

En el proceso investigativo es frecuente que en


ocasiones usemos la información de una muestra para
probar una conjetura sobre la población.

Hipótesis: Es una conjetura de


algo que puede ser posible o no El proceso estadístico inferencial
para sacar de ello una conclusión. que se utiliza para probar si la
información de una muestra acepta
o rechaza la conjetura planteada de
una población se llama prueba de
hipótesis.
LINEAMIENTOS PAR REALIZAR UNA PRUEBA DE HIPÓTESIS
1.- Cuando se pone a prueba una hipótesis acerca del valor de un parámetro
poblacional, la declaración de igualdad se incluye en la llamada hipótesis
nula que se denota por H0
2.- Lo que se detecte o sustente es la llamada hipótesis alternativa y se
denota por H1. (se constituye en la declaración de diferencia)
3.- La hipótesis de investigación HI coincide con H1, de modo tal que se
espera que los datos de la muestra lleven a rechazar la hipótesis nula H0 y
en consecuencia aceptar la hipótesis alternativa H1 que no es más que la
hipótesis de la investigación. [Milton & Arnol (2004)]

EJEMPLO: Se quiere probar la hipótesis que la edad promedio en que las


mujeres en el país X tienen su primer hijo es superior a los 22 años,
pruebe si esta afirmación es falsa o verdadera. Para probar esta
afirmación podemos realizar una prueba de hipótesis, formulando las
mismas de la siguiente forma:

H 0 :   22 Hipótesis nula.
H1 :   22 Hipótesis alternativa.
POSIBLES RESULTADOS FINALES DE CUALQUIER
PRUEBA DE HIPÓTESIS

1.- Se rechaza H0 cuando es verdadera y se comete lo que se conoce como


un error tipo I.
2.- Se toma una decisión correcta de rechazar H0 cuando es verdadera la
hipótesis alternativa, H1
3.- No se rechaza H0 cuando es verdadera la hipótesis alternativa H1. En este
caso, se comete lo que se llana un error tipo II.
4.- Se toma la decisión correcta de no rechazar H0 cuando es verdadera.
[Milton & Arnol (2004)]

Siempre que se rechace H0 se puede cometer un error tipo I y si no se


rechaza se puede cometer un error tipo II. No existe la posibilidad de evadir
esta situación. Por tanto la estadística debe diseñar un método que permita de
una forma adecuada obtener una probabilidad baja de cometer uno de estos
dos errores.
Error Tipo I: Se comete este tipo de Error Tipo II: Se comete este tipo de
error cuando es rechazada la hipótesis error cuando no rechazada la hipótesis
nula y la misma es verdadera. La nula y la hipótesis nula es verdadera.
probabilidad de cometer este tipo de La probabilidad de cometer este tipo
error se define como nivel de se representa por .
significación y se representa por .

RESUMIENDO
Situación de la prueba
Decisión
H0 es verdadera H1 es verdadera
Error tipo I Decesión
Rechazar H0
(Probabilidad ) correcta
Decesión Error tipo II
No rechazar H0
correcta (Probabilidad )
De antemano el investigador decide cual será el nivel de significación () que
utilizara en la prueba de hipótesis antes que esta se realice. Una vez definido 
también si fija la región critica de la prueba o zona de rechazo de la hipótesis
nula, veamos como se puede representar lo planteado hasta el momento.
Ejemplifiquemos con la media las tres formas que pueden tomar las pruebas
de hipótesis y como se interpreta la región critica o zona de rechazo.
Caso I Caso II Caso III

H 0 :   0 H 0 :   0 H 0 :   0
H1 :    0 H1 :    0 H1 :    0
Prueba de una Prueba de una cola Prueba de dos
cola a la derecha a la izquierda colas

  

2 2

Región critica, zona Región critica, zona Región critica, zona


de rechazo de H0 de rechazo de H0 de rechazo de H0
En este momento se debe definir la estadística paramétrica como
aquella rama de la estadística inferencial que comprende los
procedimientos estadísticos y de decisión que están basados siempre en
presuponen distribuciones particulares de la variable aleatoria (Ejemplos la
distribución normal, la t de Student). Para la inferencia paramétrica es
requerida como mínimo una escala de intervalo, esto quiere decir que
nuestros datos deben tener un orden y una numeración del intervalo.

PRUEBA DE HIPÓTESIS

La prueba de hipótesis se puede definir


como un método de toma de decisiones, FASES DE UNA PRUEBA
es decir, un procedimiento que posibilita DE HIPOTESIS
decidir si una conjetura acerca de una
población puede ser mantenida o
rechazada.
PRIMERA FASE: Definición de la hipótesis de la investigación y
posteriormente el estadígrafo de prueba y las hipótesis estadísticas.

SEGUNDA FASE: Buscar evidencia empírica relevante capaz de


informar sobre si la hipótesis definida es o no sostenible.

TERCERA FASE: Establecer una regla de decisión y esta debe estar en


términos de probabilidad, ya que se trabaja con muestras.

EJEMPLO: En una Facultad de Ingeniería donde se estudia la carrera de


Ingeniería de Sistema se realiza un cambio en el plan de estudio después
de tres corte de graduación se desea saber si este cambio esta afectando
el resultado promedio de las notas de los estudiantes.
PRIMERA FASE: Definición de la hipótesis de la investigación y
posteriormente el estadígrafo de prueba y las hipótesis estadísticas.
El cambio producido en el programa de la carrera de Ingeniería de Sistema
afecta la nota promedio de los estudiantes que se gradúan en la facultad
comparado con los resultados históricos obtenidos antes de la modificación.

 0 Media histórica de las notas de los graduados con el plan de estudio


antiguo

 Media de las notas de los graduados con el nuevo plan de estudio

Se considera que las notas promedios


Hipótesis estadísticas de los estudiantes se distribuyen
normalmente.
H 0 :   0
H1 :    0
SEGUNDA FASE: Buscar evidencia empírica relevante capaz de informar
sobre si la hipótesis definida es o no sostenible.

Realizar una indagación y determinar la media y la desviación estándar de la


población de graduados del plan de estudio antiguo, y posteriormente tomas
una muestra aleatoria del 50% de los graduados con el nuevo plan de estudio
para obtener la media los resultado obtenidos son los siguientes:
n

x i

Formula para el calculo de la media: 0  i 1


n

 x 
n
 0
2
i0
Formula para el calculo de la varianza: s 
2 i 1
(n  1)
0

Para la población de graduados con el plan de estudio antiguo se determino


una media poblacional de 3,9 y una varianza de 2,56, para la muestra
aleatoria de 56 estudiantes del nuevo plan de estudio se obtuvo la siguiente
media de 4,4.
TERCERA FASE: Establecer una regla de decisión y esta debe estar en
términos de probabilidad, ya que se trabaja con muestras.

Para este caso podemos utilizar la prueba de hipótesis de comparación


de una media contra una media poblacional y si conoce la varianza de la
población con un =0,05, esta prueba utiliza en siguiente estadígrafo.
Valor Critico z0, 025   1,96
  0 4,4  3,9
z  
2
 1,6 Región critica, zona
de rechazo de H0
n 56

z0,025  2,3385
 1,96  1,96
2,3385

Se rechaza la hipótesis nula porque el valor calculado sobrepasa el


valor critico (tabulado) y se puede afirmar que: La muestra
proporciona evidencias suficientes con un 95% de confianza de
afirmar que existen diferencias entre las notas promedios que
obtienen los estudiantes por el plan de estudio antiguo y nuevo
TERCERA FASE: Establecer una regla de decisión y esta debe estar en
términos de probabilidad, ya que se trabaja con muestras.

Para este caso podemos utilizar la prueba de hipótesis de comparación


de una media contra una media poblacional y si conoce la varianza de la
población con un =0,05, esta prueba utiliza en siguiente estadígrafo.

  0 4,4  3,9
z  
2
 1,6
n 56

z0,025  2,3385 Como la prueba es en dos colas tenemos que


=0,025 que representa la probabilidad para la zona
de rechazo, calculemos la probabilidad de 2,3385,
para ellos utilizaremos el Excel y obtenemos.

Se rechaza la hipótesis nula porque el valor calculado de probabilidad es


inferior (0,0096) a la probabilidad definida al inicio de la investigación
(=0,025 porque es en dos colas) y se puede afirmar que: La muestra
proporciona evidencias suficientes con un 95% de confianza de
afirmar que existen diferencias entre las notas promedios que
obtienen los estudiantes por el plan de estudio antiguo y nuevo
El ejemplo que acabamos de ver está relacionado con la prueba de
hipótesis para una muestra tomando como estadígrafo de contraste la
media (μ), cuando se conoce la desviación estándar (σ) poblacional, o
cuando el valor de la muestra es grande (30 o más), el valor estadístico de
prueba es z y se determina a partir de la siguiente formulas:

  0
z  Para estos casos la comparación se realiza
 contra un valor histórico o estimación realizada
con anterioridad
n

Los pasos a seguir son los descritos en el ejemplo, podemos en este


momento analizar otro caso.
Ejemplo: A un centro de tratamiento naturista de terapia florar llega un
pacientes que padecían se presión arterial sistólica (máxima) media de 140,5
mm de Hg (mililitros de mercurio), este paciente es tratados un durante 15
días con una dosis en las 8 de la mañana de un medicamento a base de un
conjunto de flores, y a las 4 de la tarde si se te toma la presión sistólica en los
días que se realiza el tratamiento y se obtienen los siguientes resultados:
Presión arterial
Días
sistólica (mm Hg)
1 día 130
2 día 132
3 día 117
4 día 154
5 día 163
6 día 121
7 día 127
Se desea saber si el tratamiento disminuye la
8 día 171 presión arterial del pacientes de forma
9 día 161 significativa con un 95% de confianza.
10 día 140
11 día 123
12 día 135
13 día 135
14 día 120
15 día 132
16 día 146
17 día 121
18 día 150
19 día 129
20 día 127
PRIMERA FASE: Definición de la hipótesis de la investigación y
posteriormente el estadígrafo de prueba y las hipótesis estadísticas.
El tratamiento con terapia florar debe disminuir la presión media sistólica del
paciente en comparación en comparación con los resultados obtenidos antes
del tratamiento.

 Media de la presión sistólica antes del tratamiento

x Media de la presión sistólica con el tratamiento florar

Hipótesis estadísticas
Se considera que las presión sistólica
H0 : x   promedios del paciente se distribuyen
H1 : x   normalmente.
SEGUNDA FASE: Buscar evidencia empírica relevante capaz de informar
sobre si la hipótesis definida es o no sostenible.

Ya se tiene la presión antes del tratamiento  con los datos obtenidos


después del tratamiento se determina la media y la desviación estándar por
medio de las formulas siguientes:
n

x i
Formula para el calculo de la media: x i 1
n
n

 ix  x 2

Formula para el calculo de la varianza: s2  i 1


(n  1)

Realicemos los cálculos con los datos obtenidos con las formulas señaladas
anteriormente
TERCERA FASE: Establecer una regla de decisión y esta debe estar en
términos de probabilidad, ya que se trabaja con muestras.

Para este caso podemos utilizar la prueba de hipótesis de comparación de una


media contra una media poblacional y no se conoce la varianza de la
población por tanto se calcula la varianza con los datos de la muestra y
utilizamos el estadígrafo t Student, con un =0,05 los cálculos son los
siguientes:
Presión arterial
Días
sistólica (mm Hg) n
1 día
2 día
130
132 x i
130  132    129  127
3 día
4 día
117
154  i 1
  136,7
5 día 163 n 20
6 día 121

 x 
7 día 127 n

8 día 171 2
9 día 161
i
10 día 140 4722,2
11 día 123 s 
2 i 1
  248,53
12 día
13 día
135
135
(n  1) 19
14 día 120
15 día 132
16 día
17 día
146
121
s  s 2  248,53  15,77
18 día 150
19 día 129
20 día 127
Después de realizar estos cálculos se puede x
comenzar el trabajo con el estadígrafo t Student t n 1 
s
  0,05 n

136,7  140
t201   0,9361
15,77
20
Prueba de una cola a
la izquierda

No se rechaza la hipótesis nula debido a que la t


calcula no cae en la zona de rechazo se puede
concluir: Que la muestra proporciona evidencias
suficientes para señalar que no existen t19  1,729
diferencias significativas entre la presión arterial
Región critica, zona
sistólica antes del tratamiento y después del
de rechazo de H0
tratamiento con un nivel de significación de 0,05.
Después de realizar estos cálculos se puede x
comenzar el trabajo con el estadígrafo t Student t n 1 
s
n
  0,05

136,7  140
t201   0,9361
15,77
20

No se rechaza la hipótesis nula debido a que la probabilidad


calculada es mayor que 0,05 se puede concluir: Que la
muestra proporciona evidencias suficientes para señalar
que no existen diferencias significativas entre la presión
arterial sistólica antes del tratamiento y después del
tratamiento con un nivel de significación de 0,05.
Estos mismos cálculos se pueden realizar con el software SPSS

Como se puede observar los resultados obtenidos son los mismos por lo que
se llega a las mismas conclusiones

Nota: Se sugiere revisar tutorial sobre el trabajo con SPSS para este tipo de
prueba estadística.
El ejemplo que acabamos de ver está relacionado con la prueba de
hipótesis para una muestra tomando como estadígrafo de contraste la
media (μ), cuando no se conoce la desviación estándar (σ), el valor
estadístico de prueba es t y se determina a partir de la siguiente formulas:

x
t n 1  Para estos casos la comparación se realiza
contra un valor histórico o estimación realizada
s con anterioridad
n

Los pasos a seguir son los descritos en el ejemplo, podemos en este


momento analizar otro caso.
Ejemplos: En un reporte nacional sobre las posibilidades de los egresados de
las universidades de obtener trabajo se plantea que uno de cada tres
graduados obtiene un puesto de trabajo. Una universidad quiere ver si esta
proporción se cumple para sus graduados para ello selecciona 130 egresados
de forma aleatoria y encontró que 56 tenían un puesto de trabajo. Los
directivos de la universidad que realiza el estudio pueden afirmar que la
proporción de egresados que obtienen trabajo es superior al reporte del
estudio con un nivel de significación igual a 0,1.
PRIMERA FASE: Definición de la hipótesis de la investigación y
posteriormente el estadígrafo de prueba y las hipótesis estadísticas.
La universidad que realiza el estudio considera que la proporción de
egresados que obtienen trabajos es superior al estudio nacional que postula
una proporción 0,33 para la obtención de trabajo por los gradudos de la
universidades

p̂ Proporción del estudio nacional 0,33

p Proporción del estudio de la universidad 0,4

Hipótesis estadísticas

H 0 : p  pˆ Se considera que las proporciones


H1 : p  pˆ estudiadas se distribuyen normalmente.
SEGUNDA FASE: Buscar evidencia empírica relevante capaz de informar
sobre si la hipótesis definida es o no sostenible.

Se cuenta con la proporción del estudio nacional y la muestra seleccionada


aleatoriamente y los que en este momento tienen trabajo con estos datos
podemos realizar los siguientes cálculos por medio de las formulas siguientes:

Proporción del nacional: pˆ  0,33

Número de casos positivos 56


Proporción del estudio p   0,43
de la universidad: Total de casos 130

Podemos pasar a la tercera fase de las pruebas de hipótesis


TERCERA FASE: Establecer una regla de decisión y esta debe estar en
términos de probabilidad, ya que se trabaja con muestras.

Para este caso vamos a utilizar la prueba de hipótesis de comparación de dos


proporciones una preestablecida y otro que se determina en el estudio, para el
contrate final utilizaremos el estadígrafo z para la determinación de la
aceptación o no de la hipótesis nula para este caso tenemos un nivel de
significación de =0,05 los cálculos son los siguientes:

p  pˆ 0,43  0,33
z 
pˆ 1  pˆ  0,33(1  0,33)
n 156

z  2,4434
Después de realizar estos cálculos se puede   0,1
comenzar el trabajo con el estadígrafo z
z  2,4434
Prueba de una
cola a la derecha

z0,1  1,28

Región critica, zona


de rechazo de H0

Se puede concluir: Los resultados obtenidos proporcionan evidencias


suficientes para rechazar la hipótesis nula y considerar que la
universidad que realiza el estudio tiene una proporción mayor de
egresados trabajando que el estudio nacional debido a que la z
calculada es superior a la z de la tabla.
Después de realizar estos cálculos se puede
comenzar el trabajo con el estadígrafo z

  0,1

z  2,4434

Se puede concluir: Los resultados obtenidos proporcionan evidencias


suficientes para rechazar la hipótesis nula y considerar que la
universidad que realiza el estudio tiene una proporción mayor de
egresados trabajando que el estudio nacional debido a que la
probabilidad calcula es inferior a 0,1.
El ejemplo que acabamos de ver está relacionado con la prueba de
hipótesis para una muestra tomando las proporciones como estadígrafo de
contraste el valor estadístico de prueba es z y se determina a partir de la
siguiente formulas:

p  pˆ
z
Para estos casos la comparación se realiza

pˆ 1  pˆ 
contra un valor histórico o estimación realizada
con anterioridad

Los pasos a seguir son los descritos en el ejemplo, a continuación


resumiremos las pruebas de hipótesis tratadas hasta el momento.
PODEMOS REALIZAR EL SIGUIENTE RESUMEN PARA LAS PRUEBAS
DE HIPÓTESIS DE UNA SOLA MUESTRA COMPARADA CON UN
PATRÓN PREESTABLECIDO.

Prueba de hipótesis para una muestra tomando


  0
como estadígrafo de contraste la media (μ),
z 
cuando se conoce la desviación estándar (σ)
poblacional, o cuando el valor de la muestra es

grande (30 o más), estadístico de contraste z. n
Prueba de hipótesis para una muestra tomando
x
como estadígrafo de contraste la media (μ), t n 1 
cuando no se conoce la desviación estándar (σ), el s
valor estadístico de prueba es t.
n

p  pˆ
z
pˆ 1  pˆ 
Prueba de hipótesis para una muestra tomando las
proporciones como estadígrafo de contraste el
valor del estadístico de prueba es z.
n
PRUEBA Z PARA LA MEDIA DE DOS MUESTRAS CON VARIANZA
POBLACIONAL CONOCIDA.
En esta prueba se contrastan dos medias muéstrales y se conoce la
varianza de las poblaciones de donde fueron extraídas estas muestras
aleatorias, el estadígrafo de contraste es z. Para la realización de los
cálculos se utiliza la siguiente formula:

z 
 X 1  X 2   1   2 0
Pero ( 1  2 )0  0
  12  22 
  
 n1 n2 
Se esta en condiciones de estudiar el siguiente ejemplo: Dos grupos de
estudiantes de una escuela son sometidos a una evaluación del sus
conocimientos matemáticos por medio de un test, los resultado los
resultados de los estudiantes se muestran a continuación, la varianza del
grupo uno es 656,4567 y la del grupo dos 597,4845:
PRIMERA FASE: Definición de la hipótesis de la investigación y
posteriormente el estadígrafo de prueba y las hipótesis estadísticas.
Los resultados de los dos grupos de estudiantes tienen medias diferentes en
las calificaciones del test de matemática con un =0,05

X 1 y  12 Media y varianza del grupo 1

X 2 y  22 Media y varianza del grupo 2

Se considera que las notas de los


estudiadas se distribuyen normalmente.
Hipótesis estadísticas
 
H 0 : X1  X 2 2 2
H1 : X 1  X 2 Prueba de dos
colas

Región critica, zona


de rechazo de H0
SEGUNDA FASE: Buscar evidencia empírica relevante capaz de informar
sobre si la hipótesis definida es o no sostenible.

Se cuenta con los resultados de los dos grupos en el tests de matemática a


partir de los cuales se debe calcular la media y se conoce la varianza
poblacional de ambos grupos:
n

x i
Formula para el calculo de la media: x i 1
n

Formula para el calculo del z 


 X 1  X 2   1   2 0
estadígrafo de prueba:   12  22 
  
 n1 n2 

Los cálculos con la segunda ecuación están implementados en el Excel


por eso apoyándonos en esta aplicación realizaremos los cálculos.
TERCERA FASE: Establecer una regla de decisión y esta debe estar en
términos de probabilidad, ya que se trabaja con muestras.

La prueba z para la media de dos muestras con varianza poblacional


conocida, es el recurso que utilizaremos para la verificación de las hipótesis
planteadas, los resultados son los siguientes

1 2
11,0 43,5 66,0 79,0 57,0 62,0 28,0 6,6
40,9 43,9 20,3 8,3 76,2 63,2 55,3 63,3
33,6 37,0 19,9 51,6 93,2 91,7 47,2 34,8
23,6 10,7 26,6 27,9 39,7 30,4 54,9 14,3
85,6 72,9 83,3 4,5 2,7 63,2 12,0 20,5
72,0 56,4 48,3 87,2 98,8 92,8 79,5 8,2
24,2 57,9 24,4 84,2 31,3 82,0 11,3 38,0
88,6 51,5 46,4 36,5 33,0 48,6 98,7 16,2
95,7 63,0 46,4 99,7 59,0 42,2 52,9 43,7
45,7 61,7 91,7 92,2 68,1 58,1 82,4 82,0
34,7 35,1 12,5 67,1 78,3 19,2
58,0 97,8 81,8 59,5 86,0 65,3
Después de realizar los cálculos con la aplica Excel, obtenemos los
siguientes resultados

Como se puede apreciar la z calculada es menor que la z critica y


consecuentemente la probabilidad calculada en mayor que 0,05 por lo que se
puede concluir: La muestra proporciona evidencias suficientes para
afirmar con un 95% de confianza que la media de las notas de los grupos
que se comparan no son diferentes

Nota: Se sugiere ver tutorial para el trabajo de esta prueba en Excel.


PRUEBA t PARA LA MEDIA DE DOS MUESTRAS EMPAREJADAS O
RELACIONADAS.
En esta prueba se contrastan dos medias muéstrales emparejadas, el
estadígrafo de contraste es t. Para la realización de los cálculos se utiliza la
siguiente formula:

d 0
t n 1  d : Media de las diferencias
sd
n
Se esta en condiciones de estudiar el siguiente ejemplo: En un colegio
inicialmente de realiza una prueba de comprensión lectora posteriormente
se da un tratamiento trascurrido un lapso de tiempo se realiza otra prueba
de comprensión lectora. Se desea saber si los resultados después del
tratamiento son significativamente superiores con un 95% de confianza,
los resultados obtenidos se muestran a continuación.
PRIMERA FASE: Definición de la hipótesis de la investigación y
posteriormente el estadígrafo de prueba y las hipótesis estadísticas.
Las calificaciones finales en la evaluación de compresión lectora son
superiores a las calificaciones iniciales con un 95% de confianza.

X1 Media de las calificaciones de compresión lectora inicial

X2 Media de las calificaciones de compresión lectora final

Se considera que las calificaciones de


los estudiadas en la compresión lectora
Hipótesis estadísticas se distribuyen normalmente.

H 0 : X 2  X1
Prueba de una
H1 : X 2  X 1 cola a la derecha

Región critica, zona


de rechazo de H0
SEGUNDA FASE: Buscar evidencia empírica relevante capaz de informar
sobre si la hipótesis definida es o no sostenible.

Se cuenta con los resultados de los dos grupos en la prueba de compresión


lectora a partir de los cuales se debe calcular la diferencia entre los pares y
con las mismas se realizan los restantes cálculos
n

Formula para el calculo de la


 x 2  x1 
d  i 1
diferencia: n
d 0
Formula para el calculo del t n 1 
estadígrafo de prueba:
sd
n

Los cálculos con la segunda ecuación están implementados en el Excel y


el SPSS por eso nos apoyamos en estos software para realizar los
cálculos.
TERCERA FASE: Establecer una regla de decisión y esta debe estar en
términos de probabilidad, ya que se trabaja con muestras.

La prueba t para la media de dos muestras emparejadas, es el recurso que


utilizaremos para la verificación de las hipótesis planteadas, los resultados son
los siguientes
Estado Inicial Estado Final
17 61 25 69 79 77 0 35 38 6 5 85 40 85 63 1
8 63 87 97 22 96 59 9 18 57 29 64 52 7 94 34
4 27 63 7 14 67 17 14 58 9 9 27 65 88 17 100
100 56 68 81 83 25 91 38 83 93 31 66 86 46 21 74
36 1 24 33 7 68 15 92 11 61 31 43 63 53 34 3
4 69 52 8 49 40 5 41 46 6 61 79 47 63 77 55
56 4 37 38 68 86 34 72 37 58 86 36 28 1 94 35
52 50 82 2 71 49 97 39 82 66 68 33 56 85 38 53
2 23 2 99 78 26 37 87 14 94 89 9 46 3 39 83
78 45 60 13 53 49 17 79 78 0 22 74 19 96 97 7
41 15 6 67 35 29 11 51 33 39 6 42 17 56 92 88
88 97 86 48 68 13 74 32 63 87 93 96 50 86 3 46
51 6 75 29 8 6 67 14 83 88 1 77 20 39 4 39
53 60 39 70 89 29 78 9 11 15 86 16 61 68 0 81
30 4 37 20 12 44 38 92 8 62 96 10 41 24 67 51
35 93 22 24 32 1 57 61 34 30 21 17 64 74 43 34
1 28 94 65 20 53 19 86 99 2 93 28 20 28 10 37
82 14 6 39 27 91 38 34 40 17 98 1 39 69 5 74
77 46 22 34 82 57 60 67 14 5 18 77 23 7
48 88 82 54 22 9 93 98 71 49 64 11 83 21
32 8 59 93 68 20 11 61 55 68 90 85 47 19
Después de realizar los cálculos con la aplica Excel, obtenemos los
siguientes resultados

Como se puede apreciar la t calculada es menor que la t critica y


consecuentemente la probabilidad calculada en mayor que 0,05 por lo que se
puede concluir: La muestra proporciona evidencias suficientes para
afirmar con un 95% de confianza que la media de las calificaciones finales
en la prueba de compresión lectora no son significativamente superiores
a las calificaciones iniciales

Nota: Se sugiere ver tutorial para el trabajo de esta prueba en Excel y SPSS.
Cálculos realizados con el SPSS

Los resultados obtenidos son similares a los obtenidos en el caso anterior con el
Excel.

Nota: Se sugiere ver tutorial para el trabajo de esta prueba en Excel y SPSS.
PRUEBA T PARA LA MEDIA DE DOS MUESTRAS NO RELACIONADAS
SUPONIENDO VARIANZA IGUALES
En esta prueba se contrastan dos medias muéstrales no emparejadas
suponiendo varianza iguales, el estadígrafo de contraste es t. Para la
realización de los cálculos se utiliza la siguiente formula:

 X  X 2   1   2 0 n
s2  1
 1s1
2
 n2  1s 2
2
t n1  n2  2  1 p
n1  n2  2
1 1
s   
2
p
 n1 n2  1  2 0  0
Se esta en condiciones de estudiar el siguiente ejemplo: En una fabrica de
bombillas se introdujo una modificación en el proceso de fabricación y se desea
conocer si esta modificación esta afectando el tiempo de vida de las bombilla,
para ello se tomo una muestra aleatoria de bombillas utilizando ambos
procedimientos y se le midió el tiempo de vida, a continuación se muestran los
datos de las dos muestras. Se quiere conocer si el tiempo de vida de las
bombillas con el procedimientos antiguo (grupo A) es menor que con el nuevo
procedimiento (Grupo B) con =0,05. Suponga varianzas iguales.
PRIMERA FASE: Definición de la hipótesis de la investigación y
posteriormente el estadígrafo de prueba y las hipótesis estadísticas.
Las bombilla producidas por el procedimiento antiguo (Grupo a) tienen un
tiempo de vida útil mejor que las bombillas producidas por el nuevo
procedimiento (Grupo B) con un nivel de significación de 0,05.

X1 Media del tiempo de vida útil del Grupo A de bombillas

X2 Media del tiempo de vida útil del Grupo B de bombillas

Se considera que el tiempo de vida útil de


las bombillas se distribuyen normalmente.
Hipótesis estadísticas

H 0 : X1  X 2 
H1 : X 1  X 2 Prueba de una cola
a la izquierda

Región critica, zona


de rechazo de H0
SEGUNDA FASE: Buscar evidencia empírica relevante capaz de informar
sobre si la hipótesis definida es o no sostenible.

Se cuenta con los resultados de los dos grupos en la prueba de vida útil de
los bombillos a partir de los cuales se debe calcular la diferencia entre las
medias para posterior mente realizar los respectivos cómputos.

t n1  n2  2 
 X 1  X 2   1   2 0
Formula para el calculo del
1 1
estadígrafo de prueba:
s   
2
p
 n1 n2 

Formula para el calculo de la n


s2  1
 1s1
2
 n2  1s 2
2
n1  n2  2
varianza en la prueba: p

Los cálculos de la prueba que se estudia están implementados en el Excel y


el SPSS por eso nos apoyamos en estos software para realizar los mismos.
TERCERA FASE: Establecer una regla de decisión y esta debe estar en
términos de probabilidad, ya que se trabaja con muestras.

La prueba t para la media de dos muestras no emparejadas con varianzas


iguales, es el recurso que utilizaremos para la verificación de las hipótesis
planteadas, los resultados son los siguientes

Grupo A Grupo B
68 122 116 64 65 74 107 83 84
111 113 68 127 91 118 89 143 134
92 78 98 55 119 76 109 107 110
73 64 53 68 103 70 105 62 126
109 85 126 86 150 98 116 70 127
123 119 66 53 98 141 127 66 127
60 50 125 99 76 124 147 82 88
79 76 117 100 111 107 115 92 123
100 50 101 59 95 117 121 76 131
123 128 56 91 111 72 91 66
80 54 62 105 143 117 127 149
101 112 84 89 88 121 109 145
58 106 124 54 78 121 115 77
72 124 107 65 63 88 112 70
85 86 95 97 86 145 110 145
57 49 62 79 76 85 123 139
Después de realizar los cálculos con la aplica Excel, obtenemos los
siguientes resultados

Como se puede apreciar la t calculada es menor que la t critica y


consecuentemente la probabilidad calculada en mayor que 0,05 por lo que se
puede concluir: La muestra proporciona evidencias suficientes para
afirmar con un 95% de confianza que la media del tiempo de vida útil de
las bombilla con el procedimiento antiguo es inferior a las fabricadas por
el nuevo procedimiento significativamente.

Nota: Se sugiere ver tutorial para el trabajo de esta prueba en Excel y SPSS.
Cálculos realizados con el SPSS

Los resultados obtenidos son similares a los obtenidos en el caso anterior con el
Excel, además en este caso también da los resultados de cuando de consideran
las varianzas desiguales que veremos a continuación.
Nota: Se sugiere ver tutorial para el trabajo de esta prueba en Excel y SPSS.
PRUEBA T PARA LA MEDIA DE DOS MUESTRAS NO RELACIONADAS
SUPONIENDO VARIANZA DESIGUALES
En esta prueba se contrastan dos medias muéstrales no emparejadas
suponiendo varianza desiguales, el estadígrafo de contraste es t. Para la
realización de los cálculos se utiliza la siguiente formula:
2
s2
s 2

 X  X 2   1   2 0 n  n 
1 2

 gl   12 2
1  2 0  0
1
t gl
s s 
2
 s1   s2 
2 2 2 2
  
1 2
n  n 
 n1 n2   1   2
n1  1 n2  1
Se esta en condiciones de estudiar el siguiente ejemplo: En una fabrica de
bombillas se introdujo una modificación en el proceso de fabricación y se
desea conocer si esta modificación esta afectando el tiempo de vida de las
bombilla, para ello se tomo una muestra aleatoria de bombillas utilizando
ambos procedimientos y se le midió el tiempo de vida, a continuación se
muestran los datos de las dos muestras. Se quiere conocer si el tiempo de
vida de las bombillas con el procedimientos antiguo (grupo A) es menor que
con el nuevo procedimiento (Grupo B) con =0,05. Supongas varianzas
desiguales.
PRIMERA FASE: Definición de la hipótesis de la investigación y
posteriormente el estadígrafo de prueba y las hipótesis estadísticas.
Las bombilla producidas por el procedimiento antiguo (Grupo a) tienen un
tiempo de vida útil mejor que las bombillas producidas por el nuevo
procedimiento (Grupo B) con un nivel de significación de 0,05.

X1 Media del tiempo de vida útil del Grupo A de bombillas

X2 Media del tiempo de vida útil del Grupo B de bombillas

Se considera que el tiempo de vida útil de


las bombillas se distribuyen normalmente.
Hipótesis estadísticas

H 0 : X1  X 2 
H1 : X 1  X 2 Prueba de una cola
a la izquierda

Región critica, zona


de rechazo de H0
SEGUNDA FASE: Buscar evidencia empírica relevante capaz de informar
sobre si la hipótesis definida es o no sostenible.

Se cuenta con los resultados de los dos grupos en la prueba de vida útil de
los bombillos a partir de los cuales se debe calcular la diferencia entre las
medias para posterior mente realizar los respectivos cómputos.

Formula para el calculo del Formula para el calculo de los


estadígrafo de prueba: grados de liberta:
2
s s 
  X 2   1   2 0
2 2

n  n 
1 2
X
t gl  1
gl   12 2
 s12 s22   s1 
2
 s2 
2
2
   n  n 
 n1 n2   1   2
n1  1 n2  1

Los cálculos de la prueba que se estudia están implementados en el Excel y


el SPSS por eso nos apoyamos en estos software para realizar los mismos.
TERCERA FASE: Establecer una regla de decisión y esta debe estar en
términos de probabilidad, ya que se trabaja con muestras.

La prueba t para la media de dos muestras no emparejadas con varianzas


desiguales, es el recurso que utilizaremos para la verificación de las hipótesis
planteadas, los resultados son los siguientes

Grupo A Grupo B
68 122 116 64 65 74 107 83 84
111 113 68 127 91 118 89 143 134
92 78 98 55 119 76 109 107 110
73 64 53 68 103 70 105 62 126
109 85 126 86 150 98 116 70 127
123 119 66 53 98 141 127 66 127
60 50 125 99 76 124 147 82 88
79 76 117 100 111 107 115 92 123
100 50 101 59 95 117 121 76 131
123 128 56 91 111 72 91 66
80 54 62 105 143 117 127 149
101 112 84 89 88 121 109 145
58 106 124 54 78 121 115 77
72 124 107 65 63 88 112 70
85 86 95 97 86 145 110 145
57 49 62 79 76 85 123 139
Después de realizar los cálculos con la aplica Excel, obtenemos los
siguientes resultados

Como se puede apreciar la t calculada es menor que la t critica y


consecuentemente la probabilidad calculada en mayor que 0,05 por lo que se
puede concluir: La muestra proporciona evidencias suficientes para
afirmar con un 95% de confianza que la media del tiempo de vida útil de
las bombilla con el procedimiento antiguo es inferior a las fabricadas por
el nuevo procedimiento significativamente.

Nota: Se sugiere ver tutorial para el trabajo de esta prueba en Excel y SPSS.
COMPARACIÓN DE RESULTADOS
En este capítulo inicialmente trabajamos las pruebas de hipótesis para
comparar una media, posteriormente estudiamos la verificación de hipótesis
para dos medias, en este momento trataremos la comparación de varias
medias poblacionales con un procedimiento estadístico que se conoce con el
nombre de análisis de varianza (ANOVA).

Población 1
Población 2 Población 3 Población 4

Muestra de Muestra de Muestra de


tamaño n1 Muestra de
tamaño n2 tamaño n3
tamaño n4

H 0 : 1   2  3   4
H1 :  i   j Al menos una de las medias i y j no son iguales
MODELO DE UN CRITERIO DE CLASIFICACIÓN

Para comprender el modelo consideremos que se desea contrastar las medias


de k poblaciones. Las situaciones experimentales a la cual se puede enfrentar
generalmente un investigador son las siguientes:

1.- Se disponen de k poblaciones, cada una representada por una característica


común que será estudiada en un experimento. Se seleccionan muestras
aleatorias independientes de tamaño n1, n2,…,nk de cada una de las k
poblaciones respectivamente. Las diferencias observadas en la respectivas
mediciones se asocia a las diferencias existente entre las k poblaciones.

2.- Se cuenta con un conjunto de N unidades experimentales homogéneas y se


desea investigar los efectos de k tratamientos diferentes. Estas unidades se
conforman aleatoriamente en k subgrupos de tamaño n1, n2,…,nk y cada uno de
los subgrupo recibe uno de los k tratamiento experimental diferente.
Veamos como se puede denotar lo planteado anteriormente: Sea Yij la j-ésima
respuesta para el i-ésimo tratamiento. Por otro lado ni es el tamaño de la
muestra extraída de la i-ésima población, por último el número total de
observaciones de las k muestras combinadas es N= n1+ n2+…+nk. Lo descrito
se puede representar por medio de la siguiente matriz.

TRATAMIENTOS

1 2 3 k
Y11 Y21 Y31  Yk1
Y12 Y22 Y32  Yk 2
Y13 Y23 Y33  Yk 3
    
Y1n1 Y2 n2 Y3n3  Ykni
Total T1. T2 . T3 . Tk . T ..
Media muestral Y1. Y2 . Y3 . Yk . Y ..
Para la realización de la prueba estadística para comprobar la hipótesis
nula de medias de tratamiento iguales se requiere de un modelo y el
mismo requiere de ciertos supuestos acerca de las diferencias aleatorías.
1.- Las k muestras son independientes y extraídas de k poblaciones
especificas, con medias desconocidas.
2.- Cada una de las poblaciones k tienen distribución normal.
3.- Cada una de las k poblaciones tienen la mismas varianza.

Partiendo de la definición del análisis de varianza y los supuestos


planteados anteriormente, se puede a la identidad que caracteriza este
procedimiento estadístico, el cual podemos representar mediante la
siguiente identidad:
Yij  Y ..  Yi .  Y ..  Yij  Yi .

Partiendo de esta identidad se puede llegar a una nueva identidad la suma


de cuadrado del análisis de varianza que podemos representar:
k nj k

 i
(Y . 
i 1 j 1
Y ..)   i i
n (2
Y .  Y ..)
i 1
2
De la identidad anterior se define la identidad de la suma de cuadrados
conceptúales del análisis de varianza con un criterio de clasificación:

SSTotal  SSTratamiento  SS Error


SSTot  SSTr  SS E
Donde:
k ni 2
T ..
SSTot   Yij  2

i 1 j 1 N
Ti .2 T ..2
k
SSTr   
i 1 ni N
SS E  SSTot  SSTr
Para la realización de la prueba de hipotes se hace necesario definir las
medias cuadradas, que se establecen de la siguiente forma:

SSTr
Media cuadrado del tratamiento MSTr 
(k  1)
SS E
Media cuadrado del error MS E 
(N  k)

Para el caso del estadígrafo de prueba tenemos lo siguiente:

MSTr
H 0 : 1  2    k Fk 1, N  k 
MS E
PODEMOS RESUMIR EL PROCEDIMIENTO PARA LA REALIZACIÓN
DEL ANOVA POR MEDIO DE LAS SIGUIENTES ECUACIONES:

Grados Sumas de Media de


Fuente de de cuadrados cuadrados F
variación libertad (SS) (MS)
(gl)

k
Ti .2 T ..2
k 1 SSTr   
SSTr MSTr
Tratamiento MSTr  Fk 1, N  k 
i 1 n i N (k  1) MS E

N k SS E
Error SS E  SSTot  SSTr MS E 
(N  k)

N 1
ni
k
T ..2
Total SSTot   Y  2
ij
i 1 j 1 N
Ejemplo: Un economista estudia la variación del contenido de plomo en
cinco tipos de gasolina y quiere saber si existen diferencias significativas
en el mismo, con un 95% de confianza, para ellos realiza un estudio
durante un mes tomando muestras aleatorias de los diferentes productos y
se obtiene los siguientes resultaos del muestreo:
Marcas de gasolina
Para comprobar esta hipótesis se
1 2 3 4 5
debe realizar un análisis de
1,51 1,69 1,56 1,3 0,73 varianza.
1,92 0,64 1,22 0,75 0,8
Las hipótesis estadísticas son
1,08 0,9 1,32 1,26 0,9
las siguientes:
2,04 1,41 1,39 0,69 1,24
2,14 1,01 1,33 0,62 0,82 H 0 : 1  2  3  4  5
1,76 0,84 1,54 0,9 0,72
1,17 1,28 1,04 1,2 0,57 H1 : i   j
1,59 2,25 0,32 1,18
Al menos dos medias i, j son
1,49 0,54
diferentes
1,3

Como se pudo observar en el cuadro anterior los cálculos para la realización de


un ANOVA son tediosos, por tantos nos apoyaremos en el Excel y el SPSS
para realizar los mismos, los resultados son los siguientes.
RESULTADOS DEL ANOVA UTILIZANDO EN EXCEL CON UN CRITERIO O
FACTOR DE CLASIFICACIÓN

Conclusiones: Como la F calculada en mayor que la tabulada y además la


probabilidad es menor que 0,05 podemos concluir: La muestra proporciona
evidencias estadísticas para afirma que al menos entre dos tipos de
gasolinas las medias del contenido de plomo son diferentes
significativamente con un 95% de confianza.

Nota: Ver tutorial para realizar un ANOVA en Excel.


RESULTADOS DEL ANOVA UTILIZANDO EN SPSS CON UN CRITERIO O FACTOR
DE CLASIFICACIÓN

Conclusiones: Como la F calculada en mayor que la tabulada y además la


probabilidad es menor que 0,05 podemos concluir: La muestra proporciona
evidencias estadísticas para afirma que al menos entre dos tipos de
gasolinas las medias del contenido de plomo son diferentes
significativamente con un 95% de confianza.

Nota: Ver tutorial para realizar un ANOVA en SPSS.


MODELO DE DOS CRITERIO DE CLASIFICACIÓN

Este procedimiento se emplea cuando se deseas contrastar las medias de k


poblaciones en presencia de una variable extraña. Se denomina bloque a un
conjunto de k unidades experimentales de análisis tan similares como sea
posible en lo relativo a la variable extraña que se quiere controlar. Los
tratamientos se asignan a cada bloque de forma aleatoria, para que de esta
forma el efecto de la variable extraña se controla por el emparejamiento de
las unidades experimentales, esto permite afirmar que las variaciones que se
observan en las unidades experimentales sean una respuesta al tratamiento.

La adecuada utilización de los bloques considerando que los mismos sean


relativamente homogéneos y las de los bloque heterogéneos, hace del
modelo de análisis de varianza de dos clasificaciones sea más sensible que
el modelo de una clasificación a las diferencias observadas por la aplicación
de los tratamientos.
LOS SUPUESTOS DEL MODELO DE DOS CRITERIO DE
CLASIFICACIÓN SON LOS SIGUIENTES:

1.- Las k  b observaciones constituyen muestras aleatorias


independientes, con un tamaño 1 de la k  b poblaciones objeto de estudio
con medias desconocidas.
2.- Cada una de las k  b poblaciones tiene distribución normal.
3.- Cada una de las k  b poblaciones tienen la misma varianza.
4.- Los efectos de bloques y tratamientos son aditivos, por tanto no existen
interacciones entre los bloques y los tramientos.
PODEMOS REPRESENTAR LO TRATADO HASTA EL MOMENTO EN LA
SIGUIENTE MATRIZ MODELO DE DOS CRITERIO DE CLASIFICACIÓN

TRATAMIENTOS
Bloque Media del
1 2 3  k total bloque

1 Y11 Y21 Y31  Yk1 T .1 Y .1


2 Y12 Y22 Y32  Yk 2 T .2 Y .2
BLOQUES

3 Y13 Y23 Y33  Yk 3 T .3 Y .3


       
b Y1b Y2b Y3b  Ykb T .b Y .b
Total del tratamiento T1. T2 . T3 .  Tk . T ..
Media del tratamiento Y1. Y2 . Y3 .  Yk . Y ..
Realizando un estudio similar al análisis de varianza de un criterio de
clasificación podemos llegar a las identidades fundamentales de ANOVA con
dos criterios de clasificación :

SSTotal  SSTratamiento  SS Bloques  SS Error


SSTot  SSTr  SS Bl  SS E
k ni 2
Donde: T ..
SSTot   Yij2 
i 1 j 1 N
k 2 2
Ti . T ..
SSTr   
i 1 b N
2
b T.j T ..2
SS Bl   
j 1 k N
SS E  SSTot  SSTr  SS Bl
Para la realización de la prueba de hipotes se hace necesario definir las
medias cuadradas, que se establecen de la siguiente forma:

SSTr
Media cuadrado del tratamiento MSTr 
(k  1)
SS Bl
Media cuadrado del bloque MS Bl 
b  1
SS E
MS E 
k  1  b  1
Media cuadrado del error

Para el caso del estadígrafo de prueba tenemos lo siguiente:

H 0 : 1  2    k Fk 1,k 1b 1 


MSTr
MS E
PODEMOS RESUMIR EL PROCEDIMIENTO PARA LA REALIZACIÓN
DEL ANOVA POR MEDIO DE LAS SIGUIENTES ECUACIONES:

Fuentes de Grados de Suma de Media de cuadro F


Variación libertad cuadrado (SS) (MS)
(gl)

Ti .2 T ..2 SSTr MSTr


MSTr 
k
Fk 1,k 1b 1 
Tratamiento k 1 SSTr   
(k  1) MS E
i 1 b N
2
b T.j T ..2 SS Bl MS Bl
b 1 SS Bl    MS Bl 
Bloque
j 1 k N b  1 MS E

k 1b 1 SS E  SSTot  SSTr  SS Bl SS E


MS E 
Error k  1  b  1
ni
k
T ..2
kb  1 SSTot   Y  2
Total i 1 j 1 N
ij
EFECTIVIDAD DE LOS BLOQUES

Estrategia para comprobar la efectividad de la utilización del ANOVA con dos


criterios de clasificación
 MS Bl 
El procedimiento para tener una ER  c  1  c  
idea de las efectividad es la
definición de la eficacia relativa
 MS E 
por medio de la ecuación bk  1
c
bk  1
planteada anteriormente

ER  1 El diseño de dos criterios de clasificación ni ayuda ni causa daño

ER  1 El diseño de dos criterios de clasificación no resulta útil

ER  1 El diseño de dos criterios de clasificación es beneficioso

Este procedimiento es tedioso de realizar los calculos necesarios para


realizar el mismo, no obstante el mismo se encuentra implementado en
Excel, veamos un ejemplo.
Ejemplo: Los directivos de un sistema de salud que cuentan con 6 hospitales
en diferentes partes de una ciudad y desean evaluar 4 tratamientos para
atender una enfermedad respiratoria. Cada hospital con sus equipos
médicos aplican uno de los tratamientos al azar a los enfermos y determina
el tiempo en el cual el paciente se recupera de la enfermedad respiratoria. Se
desea saber si entre los tratamiento existen diferencias significativas con un
95% de confianza.

Tratamiento Tratamiento Tratamiento Tratamiento


1 2 3 4
Hospital A 9 9 10 11
Hospital B 9 4 4 1
Hospital C 10 3 3 3
Hospital D 9 2 5 3
Hospital E 7 5 4 3
Hospital F 8 4 3 4

H 0 : 1  2  3  4

H1 : i   j Al menos dos medias son diferentes


RESULTADOS DEL ANOVA UTILIZANDO EN EXCEL CON DOS CRITERIO O
FACTOR DE CLASIFICACIÓN

Se puede observar que la prueba es eficaz y además de rechaza la hipótesis


nula de acuerdo a los resultados de F y la probabilidad se puede concluir que:
Las muestras proporcionan evidencias suficientes para afirmar que medias
del tiempo se respuesta al tratamiento es diferente con un 95% de
confianza.
Nota: Ver tutorial del trabajo con Excel
POSIBLES BIBLIOGRAFÍA QUE PUEDEN SER UTILIZADAS EN EL CURSO.
 Murray Spiegel. Probabilidad y Estadística. Editorial McGraw.Hill. España 2010.
David Moore. Estadística Aplicada Básica. Editorial Mozart Art.S.L. España 2004.
Antonio Vargas. Estadísticas Descriptiva e Inferencial. Editorial Compobell. S.L. España 1995.
Elmer Mode. Elementos de Probabilidad y Estadística. Editorial Reverté. S.A. España. 2005.
Irwin Miller y John Freund. Probabilidad y Estadística para Ingeniero. Editorial Reverté. S.A.
México. 2004
2004. Juan Murgiondo y Javer Tejedor. Análisis Descriptivo de datos en Educación. Editorial
Murralla. S.A. España. 2005.
Roberto Pagano. Estadística para las ciencias del comporamiento. Editorial Thonson. México.
2003.
Geolfrey Norman y David Streiner. Bioestadística. Editorial Harcourt. España. 2005.
 Robert Soka y Rohlf F. Introducción a la bioestadística. Editorial Reverté S.A. España. 2002.
Sidney Siegel y John Castella. Estadística no paramétrica. Aplica a las ciencias de la conducta.
Editorial Trilla. México. 1998.
Jay Davore. Probabilidad y Estadística para Ingeniería y Ciencias. Editorial Thomson. México.
2001.
Susan Milton y Jesse Arnold. Probabilidad y Estadística con aplicaciones para la ingeniería y
ciencias computacionales. Editorial McGraw Hill. México. 2004
Eduardo Bologna. Estadística para Psicología y Educación. Editorial Brujas. Argentina. 2011.

You might also like