Professional Documents
Culture Documents
Procedimiento:
Xi
Y1 Y2
Yj
.. YC
.
fi
.
f j .
f 1 .
f 2 .. .
f C n
( Oi j ei j )2
2 = ei j
Oij : Frecuencias observadas.
eij : Frecuencias esperadas
Para lo cual previamente debern calcularse las frecuencias esperadas.
En el caso de las pruebas de independencia; las frecuencias esperadas se
calculan usando las frecuencias observadas de la tabla de doble entrada
(tabla de contingencia), para lo cual se utiliza la siguiente frmula:
ei j = . .
fi f j
n
En el caso de la prueba de homogeneidad; las frecuencias esperadas se
calculan mediante: eij = n Pi donde las Pi se calculan de acuerdo a la
distribucin que se est haciendo el ajuste.
4. Se toma la decisin, teniendo en cuenta la ubicacin de la estadstica de prueba.
Esta prueba se usa en general cuando el investigador desea saber si dos variables estn o
no asociadas. Si no hay asociacin entre las variables, se dice que ambas son
independientes, trmino que se emplea para indicar que la distribucin de una de ellas no
depende en absoluto de la distribucin de la otra.
Si dos variables no son independientes, ello significa que el conocimiento de una de ellas
puede ayudarnos de alguna forma a conocer la otra. Es decir, se aplica para establecer si
hay alguna relacin o dependencia en cuanto a los criterios de clasificacin de la
informacin.
Procedimiento:
1. Hiptesis:
H0 : Existe independencia (no existe relacin).
H1 : No existe independencia (existe relacin)
2. Valor Crtico: 21 , ( F 1 ) ( C 1 )
3. Estadstica de Prueba:
2 =
( Oi j ei j )2
, ei j = . .
fi f j
ei j n
4. Decisin: Si RA
2
Aceptar H0
5. Conclusin:
Responder a la pregunta formulada, especificando el nivel de confianza.
Ejemplo:
Solucin:
1. Hiptesis:
H0 : No existe relacin entre situacin de empleo y estado del prstamo.
H1 : S existe relacin entre situacin de empleo y estado del prstamo.
5.99
La estadstica de prueba se calcul en base a los siguientes datos:
Situacin de empleo en el
Estado actual del
Prstamo
momento del prstamo
Empleado Desempleado
.
fi
10 8 18
En mora
11.74 6.26
60 22 82
Al da
53.48 28.52
5 10 15
No paga
9.78 5.22
.
f j 75 40 n = 115
5. Conclusin:
Con una confianza del 95%, podemos afirmar que s existe relacin entre situacin
de empleo y estado de prstamo.
Nota:
Si existe independencia entre las variables, los valores esperados y observados sern
parecidos y el valor de 2 ser pequeo.
Clic en Aceptar.
COEFICIENTE DE CONTINGENCIA
C =
2
n + 2
Donde:
En el ejemplo:
9.74
C = = 0.279 < 0.30
115 + 9.74
Esta prueba permite verificar si una muestra aleatoria procede de una poblacin con una
distribucin de probabilidad conocida (Binomial, Poisson, Normal).
Para aplicar esta prueba primero debern agruparse los datos de la muestra en una tabla y
luego estimar los verdaderos parmetros de la poblacin en caso que no sean dados ( p , ,
y ) segn el caso.
Las frecuencias esperadas e ij para cada valor de X (binomial y Poisson) o para cada
intervalo (Normal) se calculan hallando primero las probabilidades de ocurrencia pi usando
la frmula del modelo supuesto, las tablas correspondientes o el Minitab.
Procedimiento:
1. Hiptesis:
2. Valor Crtico:
21 , k p 1
p : nmero de parmetros que se estimaron)
k : N de eij 5 (despus de reagrupar las eij < 5)
3. Estadstica de Prueba:
2
k ( Oij eij )
2
=
eij
, ei j = n pi
i =1
4. Decisin:
Si 2 R A Aceptar H0
5. Conclusin:
Nota:
Ejemplo 1:
Los siguientes datos se refieren a los salarios de 120 trabajadores de una compaa. Con un
nivel de significancia del 5%, podemos afirmar que la distribucin se aproxima a una
normal?
Solucin:
1. Hiptesis:
3. Estadstica de Prueba:
( Oij eij )2
6
2
= = 15.74
i =1 eij
7.81
Salarios Xi N de trabajadores pi e ij = n p i
150-156 153 14 0.05444 6.53
156-162 159 12 0.14532 17.44
162-168 165 22 0.24938 29.93
168-174 171 40 0.26161 31.39
174-180 177 20 0.17572 21.09
180-186 183 12 0.07523 9.03
Total n = 120
= x = 168.8
= S = 8.66
5. Conclusin:
Con una confianza del 95% podemos afirmar que la distribucin no se aproxima a
una normal.
= x = 168.8
= S = 8.66
p1 = P (150 X 156 ) =
Clic en rea sombreada, luego en Valor X, a continuacin elegir Centro y luego ingresar los
dos valores de X es decir 150 y 156.
Clic en Aceptar.
Grfica de distribucin
Normal; Media=168,8; Desv.Est.=8,66
0,05
0,04
0,03
Densidad
0,02
0,01 0,0547
0,00
150 156 169
X
Ejemplo 2:
El nmero de defectos por unidad observada en una muestra de 100 radios dio la siguiente
distribucin de frecuencias.
N de defectos : 0 1 2 3 4 5 6 7
N de radios : 28 32 15 10 6 4 3 2
Solucin:
1. Hiptesis:
H0 : Los datos se aproximan a una distribucin Poisson.
H1 : Los datos no se aproximan a una distribucin Poisson.
2. Valor Crtico:
2 = 20.95 , 3 = 7.81 p = 1:
0.95 , 5 1 1
3. Estadstica de Prueba:
5 ( Oij eij )2
=
2
= 15.12
i =1 eij
7.81
0 28 0.186 18.6
1 32 0.313 31.3
2 15 0.263 26.3
3 10 0.147 14.7
4 6 0.062 6.2
5 4 15 0.021 2.1
9
6 3 0.006 0.6
7 2 0.001 0.1
Total n = 100
1.68 x
e 1.68
= x = 1.68 pi =
x!
4. Decisin:
2 = 15.12 R R Re chazar H0
5. Conclusin:
Con una confianza del 95% podemos afirmar que la distribucin de estos datos no se
aproxima a una Poisson.
Las probabilidades p i , se pueden calcular usando el Minitab, para lo cual se deben digitar
en C1 los valores correspondientes a X y luego a la columna C2 se le pone el ttulo de: Pi
Ejemplo 3:
N de computadoras : 0 1 2 3
N de das : 1 16 55 228
Probar en el nivel del 5% si se puede considerar como valores de una variable aleatoria
binomial.
Solucin:
1. Hiptesis:
H0 : La distribucin es Binomial.
H1 : La distribucin no es Binomial.
= n p n : N de computadoras vendidas
x 2.7
x = n p p = = = 0.9 q = 1 0.9 = 0.10
n' 3
3. Estadstica de Prueba:
3 ( Oi j e i j )2
2
= ei j
= 13.6
i =1
3.84
2
4. Decisin: = 13.6 R R Re chazar H0
5. Conclusin:
Con una confianza del 95% no podemos considerar los datos como valores de una
variable aleatoria binomial.
DISEO DE EXPERIMENTOS
Experimento
Este trmino se utiliza para planear un experimento de manera que se pueda obtener la
informacin pertinente a un determinado problema que se investiga y as tomar decisiones
correctas. El diseo adecuado del experimento es una etapa fundamental de la
experimentacin, que permite el suministro correcto de datos a posteriori, lo que a su vez
conducirn a un anlisis objetivo y con deducciones vlidas del problema.
Un experimento diseado no es ms que una prueba o una serie de pruebas en las que se
inducen cambios deliberados en las variables de entrada de un proceso o sistema, de
manera que sea posible observar e identificar las causas de los cambios en la respuesta de
salida.
Anlisis de un experimento
Variable independiente
Ejemplo:
Es toda aquella variable que es explicada por el modelo y refleja el efecto de las variables
independientes.
Ejemplo:
Variables exgenas
Son todas aquellas variables que explican a la variable dependiente en menor escala que las
variables independientes. Generalmente no tiene ninguna importancia para el investigador.
El investigador deber controlar estas variables puesto que ocasionan en el experimento
variaciones que no resultan convenientes.
Ejemplo:
Factor o tratamiento
Los tratamientos son los diferentes procedimientos, procesos, factores o materiales cuyos
efectos van a ser medidos y comparados. El tratamiento establece un conjunto de
condiciones experimentales que deben imponerse a una unidad experimental dentro de un
diseo seleccionado.
Se emplea como sinnimo de variable independiente. Es decir son todas aquellas variables
cuyos efectos se desean medir. Pueden ser cuantitativas o cualitativas.
Ejemplo:
Unidad experimental
Es la entidad ms pequea a la que se aplica un tratamiento. Son los objetos sobre los
cuales se hacen mediciones y se analiza la variable que se investiga.
Aleatorizacin
Error experimental
Repeticin
Proporcionar mtodos que permitan obtener la mayor cantidad de informacin vlida acerca
de una investigacin, teniendo en cuenta el factor costo y el uso adecuado del material
disponible mediante mtodos que permitan disminuir el error experimental.
Es una tcnica estadstica que sirve para analizar la variacin total de los resultados
experimentales de un diseo en particular, descomponindolo en fuentes de variacin
independientes atribuibles a cada uno de los efectos en que constituye el diseo
experimental.
Una suposicin fundamental del ANOVA es que las varianzas son homogneas. Esta
suposicin se emplea para estimar una varianza comn (el Cuadrado Medio del Error CME)
que sirva para realizar comparaciones entre las medias de los tratamientos.
Los mtodos de diseo experimental tambin son tiles en las actividades de ingeniera de
diseo, donde se desarrollan nuevos productos y se mejoran los existentes. Algunas
aplicaciones representativas de los experimentos diseados de manera estadstica en la
ingeniera de diseo incluyen:
- Evaluacin y comparacin de configuraciones de diseo bsicas.
- Evaluacin de materiales diferentes.
- Seleccin de parmetros de diseo de modo que el producto funcione bien bajo una
gama amplia de condiciones de campo.
El empleo del diseo experimental en el proceso de diseo puede dar como resultado
productos que son ms fciles de fabricar, productos que tienen un desempeo y una
confiabilidad mejores que los de la competencia, y productos que pueden disearse,
desarrollarse y producirse en menor tiempo.
Es aquel modelo en el cual las unidades experimentales sobre las que se toman medidas se
asignan al azar a los diferentes factores o tratamientos (variable independiente).
Se utiliza cuando el experimentador cuenta con los resultados de k muestras aleatorias
independientes, cada una de tamao ni y le interesa probar la hiptesis de que las medias
de las k poblaciones son todas iguales.
Para probar esta hiptesis se supondr estar trabajando con poblaciones normales que
tienen varianzas iguales. Si uno o los dos supuestos no se cumplen entonces deber
aplicarse la prueba no paramtrica de Kruskal-Wallis.
G1 G2 G1 G2 G3
La prueba t nos dice si existe diferencia entre los promedios de dos grupos. Podramos
entonces efectuar pruebas t para cada pareja de grupos. Sin embargo el nmero de pruebas
aumentara a medida que hubieran ms grupos. El ANOVA nos da un solo valor para la
comparacin colectiva o global.
El ANOVA fue ideado por Fisher en 1925 y permite comprobar si existen diferencias entre
promedios de tres o ms tratamientos; para ello se calcula el valor de F. Cuando
encontramos el valor de F sabremos si existen diferencias entre los grupos, pero no nos dice
entre cules grupos, y por eso debemos aplicar posteriormente otros tests llamados de
comparacin mltiple.
Esta tcnica permite no slo analizar los datos sino tambin planificar los experimentos, por
lo tanto el anlisis de varianza es un procedimiento estadstico que nos permite dividir la
variabilidad observada en componentes independientes que pueden atribuirse a diferentes
causas de inters.
1. Hiptesis:
H0 : 1 = 2 = ........ = k
H1 : Las i no son todas iguales
2. Valor Crtico: C
F1 , k 1 , Nk
Para obtener este valor F se construye la siguiente tabla llamada tabla de ANOVA.
4. Decisin:
5. Conclusin:
PRUEBA DE TUKEY
(x i )
xj q , k , Nk CME
n
para ni iguales
CME 1 1
(x i )
xj q , k , Nk
2 ni
+
nj
para ni diferentes
Ejemplo 1:
Solucin:
k = 4 grupos N = 20 datos
1: Baja 2: Normal 3: Alta 4: Muy Alta
8.0 7.6 6.0 5.1
8.1 8.2 6.3 5.6
9.2 9.8 7.1 5.9
9.4 10.9 7.7 6.7
11.7 12.3 8.9 7.8
T1. = 46.4 T2 . = 48.8 T3 . = 36.0 T4 . = 31.1
n1 = 5 n2 = 5 n3 = 5 n4 = 5
x1 = 9.28 x 2 = 9.76 x 3 = 7.20 x 4 = 6.22
T= X i j = 162.30 X 2i j = 1393.15
1ero.- Se realizar la prueba para verificar si las varianzas poblacionales de los cuatro
grupos son iguales.
H0 : 12 = 22 = 23 = 24
H1 : Al menos una 2i es diferente
Clic en Aceptar.
Prueba de Bartlett
0 2 4 6 8 10 12
Intervalos de confianza de Bonferroni de 99% para Desv.Est.
Conclusin: Con una confianza del 99%, concluimos que las varianzas son iguales.
1. Hiptesis:
H0 : 1 = 2 = = 4
3
H1 : Al menos un i es diferente
2. Valor crtico: F1 , k 1 , N k
F0.99 , 3 , 16 = 5.29
5.29
3. Estadstica de prueba:
CM(tr )
F =
CME
5. Conclusin:
Con una confianza del 99% podemos afirmar que los tiempos promedio de falla de
las bateras se diferencian entre s.
3ero.- Para averiguar si existe diferencia altamente significativa solamente entre el grupo de
bateras con presin baja y el grupo de bateras con presin muy alta, deber
realizarse Tukey.
( )
xi x j q , k , Nk
CME
n
q , k , Nk = q 0.01 , 4 , 16 = 5.19
1 restado de 2:
2.10
( 9.76 9.28 ) 5.19 2.88 2 1 3.84 0 IC 2 = 1
5
1 restado de 3:
2.10
( 7.20 9.28 ) 5.19 5.44 3 1 1.28 0 IC 3 = 1
5
1 restado de 4:
2.10
( 6.22 9.28 ) 5.19 6.42 4 1 0.30 0 IC 4 = 1
5
2 restado de 3:
2.10
( 7.20 9.76) 5.19 5.92 3 2 0.80 0 IC 3 = 2
5
2 restado de 4:
2.10
( 6.22 9.76) 5.19 6.90 4 2 0.18 0 IC 4 2
5
3 restado de 4:
2.10
( 6.22 7.20 ) 5.19 4.34 4 3 2.38 0 IC 4 = 3
5
Clic en Comparaciones
Los cuatro intervalos se intersectan, sin embargo; pareciera que los intervalos 2 y 4 no se
intersectan.
k = 4 grupos N = 20 datos
A B C D
51 30 80 53
42 48 75 47
35 44 85 45
65 56 73 50
49 54 71
40
T1. = 242 T2 . = 272 T3 . = 313 T4 . = 266
nA = 5 nB = 6 nC = 4 nD = 5
x A = 48.40 x B = 45.33 x C = 78.25 x D = 53.20
T= X i j = 1093 X 2i j = 64171
1ero.- Se verificar si las varianzas poblacionales de los cuatro grupos son iguales.
H0 : 2A = 2B = 2C = 2D
Clic en Aceptar.
Prueba de Bartlett
0 10 20 30 40 50
Intervalos de confianza de Bonferroni de 95% para Desv.Est.
Conclusin: Con una confianza del 95%, concluimos que las varianzas son iguales.
1. Hiptesis:
H0 : A = B = C = D
H1 : Al menos un i es diferente
3.24
2. Valor crtico: F0.95 , 3 , 16 = 3.24
3. Estadstica de prueba:
5. Conclusin:
Con una confianza del 95% podemos afirmar que los tiempos promedio que
necesitaron los cuatro grupos para la realizacin de la tarea se diferencian
significativamente entre s.
3ero.- Se realizar la prueba de Tukey para determinar entre qu grupos existe diferencia
significativa.
CME 1 1
(x i )
xj q , k , Nk
2 ni
+
nj
q , k , Nk = q 0.05 , 4 , 16 = 4.05
A restado de B:
92.8 1 1
( 45.33 48.40 ) 4.05 + 19.78 B A 13.64 B = A
2 6 5
A restado de C:
92.8 1 1
( 78.25 48.40 ) 4.05 + 11.34 C A 48.36 C A
2 4 5
A restado de D:
92.8 1 1
( 53.20 48.40 ) 4.05 + 12.65 D A 22.25 D = A
2 5 5
B restado de C:
92.8 1 1
( 78.25 45.33) 4.05 + 15.11 C B 50.73 C B
2 4 6
B restado de D:
92.8 1 1
( 53.20 45.33) 4.05 + 8.84 D B 24.58 D = B
2 5 6
C restado de D:
92.8 1 1
( 53.20 78.25 ) 4.05 + 43.56 D C 6.54 D C
2 5 4
Clic en Comparaciones
En el grfico se puede apreciar que existe diferencia entre los promedios de los
grupos A y C , B y C , C y D ya que estos intervalos no se intersectan.
PRCTICA N 5
Prueba Chi Cuadrado DCA Tukey
2.- Se desea comparar la utilizacin de cuatro hojas de clculo diferentes y para ello se
pone a grupos de empleados para que trabajen con cada hoja y luego se anota el
nmero de errores que cada uno de ellos cometi. Los resultados obtenidos en este
estudio fueron:
Podemos afirmar que existe una diferencia significativa entre las hojas de clculo?
Si es as, cul hoja de clculo presenta un promedio mayor?
ep = 3.1 rechazar Ho hoja 3
Adaptacin al Matrimonio
Educacin
Muy bajo Bajo Alto Muy alto
Universitaria 18 29 70 115
Secundaria 17 28 30 41
Primaria 11 10 11 20
Existe relacin entre el nivel educacional de un individuo y su adaptacin al
matrimonio? ep = 19.4 P = 0.03
Voltaje de
N de unidades
salida
<4.948 12
4.948-4.986 14
4.986-5.014 12
5.014-5.040 13
5.040-5.066 12
5.066-5.094 11
5.094-5.122 14
5.122 12
Podemos afirmar que no hay evidencia fuerte que indique que el voltaje de salida no
est distribuido de manera normal? ep = 3.03 Aceptar Ho
Categora Ocupacional
Satisfaccin
Tcnico Mdico Administr. Servicio
S 30 50 22 18
No 10 10 2 18
Se realiz una prueba poco significativa, se puede afirmar que la satisfaccin est
asociada con la categora ocupacional? ep = 17.78 rechazar Ho
Sin embargo el gerente no sabe mucha estadstica, por lo cual contrata a un estadstico,
quien luego de realizar el anlisis le aconseja que, puede comprar cualquiera de las
mquinas. El gerente tiene sus dudas con respecto a esta recomendacin, Podra
ayudarle, explicndole en qu se bas el estadstico?
ep = 2,54 P = 0,112
9.- Se clasific una muestra aleatoria de hombres casados, todos jubilados, de acuerdo
con su nivel de educacin y el nmero de hijos.
Nmero de hijos
Educacin
0-1 2-4 Ms de 4
Primaria 43 41 36
Secundaria 107 152 81
Universidad 30 47 63
Se puede afirmar que es alta la asociacin entre el tamao de una familia y el nivel
de educacin alcanzado por el padre?
ep = 24.21 Aceptar H1 No 0.20
10.- Tres proveedores diferentes proporcionan piezas en lotes de 500. Para comparar la
calidad de los lotes se toman muestras aleatorias de seis lotes de cada proveedor y se
examinan para determinar el nmero de piezas no conformes. Los resultados fueron:
Proveedor:
A : 28 37 34 29 31 33
B : 22 27 29 20 18 30
C : 33 29 39 33 37 38
Podemos afirmar que al menos uno de los proveedores es diferente en cuanto a su
promedio? ep = 0,944 aceptar Ho
Se puede afirmar que quienes tienen sentido del humor, tienen xito en la vida?
ep = 17.098 P = 0.002
12.- Una empresa est interesada en comparar los pagos iniciales por hora de los
graduados en administracin de tres universidades A, B y C. Para estudiar el caso se
eligieron muestras aleatorias de seis graduados de administracin de cada
universidad. La tabla muestra el salario por hora inicial de cada ingeniero.
Universidad: Pago por hora (dlares)
A : 21,25 21,25 22,35 22,25 22,00 21,85
B : 22,50 23,05 23,12 23,35 22,55 22,60
C : 21,75 22,00 20,85 21,61 22,10 22,15
8 0 0 1 3 4 0 2 12 5
1 8 0 2 0 1 9 3 4 5
3 3 4 7 4 0 1 2 1 2
Da de la semana
Lunes Martes Mircoles Jueves Viernes
Sin defectos 85 90 95 95 90
Defectuosos 15 10 5 5 10
Con una confianza del 99%, Existe la evidencia suficiente para afirmar que el
nmero de artculos defectuosos nada tiene que ver con el da de la semana en que
se fabrican? ep = 8.55 P = 0.073
Banca : 12 10 10 12 10
Comercio : 8 8 6 8 10
Seguros : 10 8 6 8 10
17.- Una empresa est intentando decidir cul de entre tres tipos de automviles
consume menos uno americano, uno japons y otro europeo. Para verlo, se toman
muestras de cada tipo y a cada automvil se le hace recorrer 100 kilmetros y se
anota el consumo. Los resultados son los siguientes:
22- Los siguientes datos corresponden a los docentes que trabajan en una universidad,
clasificados segn su categora y su satisfaccin en el trabajo.
Categora del Docente
Satisfaccin
en el Trabajo Jefe de Profesor Profesor Profesor
Prctica Auxiliar Asociado Principal
Mucha 40 60 52 63
Regular 78 87 82 88
Poca 57 63 66 64
Podemos afirmar con una confianza del 98% que la categora de un docente influye
en su satisfaccin en el trabajo? ep = 2.75 P = 0.839
23.- Un socilogo desea determinar si existe una relacin entre la inteligencia de jvenes
que se han sometido a un programa de capacitacin especial en el trabajo y su
desempeo subsiguiente en sus empleos. Una muestra de 400 casos tomados de
archivos muy grandes produjo los siguientes resultados:
Desempeo
Cociente Intelectual
Deficiente Regular Bueno
Debajo del promedio 67 64 25
Promedio 42 76 56
Arriba del promedio 10 23 37
Se puede concluir que existe buena asociacin entre el desempeo en el trabajo y la
inteligencia? ep = 41.01 P = 0.00
24.- Se clasific una muestra aleatoria de 90 adultos, de acuerdo con su sexo y el nmero
de horas que ven televisin durante una semana.
Sexo
Horas
Masculino Femenino
Ms de 25 15 29
Menos de 25 27 19
Es buena la asociacin entre el sexo de las personas y el nmero de horas que ven
televisin durante la semana? . ep = 5.47 P = 0.019
25.- Los siguientes datos se refieren a los salarios ($) de 130 trabajadores de una
empresa elegidos en forma aleatoria. Si se sabe que el promedio es 165 y la varianza
25.
Salarios ($) N de trabajadores
< 156 18 Verificar si la distribucin
156-160 20 dada se aproxima a una
160-164 9 distribucin normal.
164-168 45
168-172 28
172 10
ep = 34.17 rechazar Ho
27.- Se registr el nmero de accidentes, por semana, en cierto cruce de caminos durante
una muestra aleatoria de semanas, con los resultados que se muestran a
continuacin:
N de accidentes : 0 1 2 3 4 5
N de semanas : 52 32 16 9 11 7
Verificar si la variable aleatoria nmero de accidentes tiene una distribucin
conocida, suponiendo que las observaciones son independientes.
Variable Frecuencia
< 2.5 6
2.5-3.8 30
3.8-5.0 41
5.0-6.2 52
6.2 12
Mquinas
A B C D
17,5 16,4 20,3 14,6
16,9 19,2 15,7 16,7
15,8 17,7 17,8 20,8
18,6 15,4 18,9 18,9
Con un nivel de significancia de 0.05, Podemos afirmar que al menos una de las
mquinas presenta diferente promedio? ep = 0.84 aceptar Ho
34.- Se desea probar si el nmero de rayos gamma emitidos por segundo por cierta
sustancia radiactiva es una variable aleatoria que tiene la distribucin de Poisson.
Para ello se cuenta con los datos obtenidos en 300 intervalos de un segundo.
N de rayos gamma 0 1 2 3 4 5 6 7
Frecuencia 19 48 66 74 44 35 10 4
Obtener una conclusin altamente significativa. ep = 5.14 Aceptar Ho
35.- Con el fin de planear cunto dinero en efectivo se debe dejar a la mano en la caja
fuerte de un banco, el gerente est interesado en ver si el depsito promedio de un
cliente est distribuido normalmente. Se sabe que la media es S/1500 y la varianza
360000.
Depsito N de clientes
< 1000 10
1000- 2000 65
2000-3000 86
3000-4000 58
4000-5000 72
5000-6000 43
6000 5
Un empleado recin contratado, con la esperanza de ser ascendido, ha recolectado la
informacin de la tabla anterior y desea probar si la distribucin es normal.
36.- Cada da, de lunes a sbado, un repostero hornea cuatro pasteles grandes de
chocolate y los que no se venden el mismo da se regalan a un centro de
beneficencia.
N de pasteles vendidos 0 1 2 3 4
N de das 2 18 52 96 228
Probar si se pueden considerar valores de una variable aleatoria conocida.
37.- La tabla siguiente est basada en una encuesta acerca de los ingenieros de sistemas,
realizada en una ciudad. Se les dividi en tres grupos en base a su currculum
acadmico y a sus ingresos al cabo de 10 aos de ejercicio.
Ingreso
Currculum Alto Mediano Bajo
Acadmico
Alto 18 17 5
Mediano 26 38 16
Bajo 6 15 9
El hecho de tener un tipo de currculum afecta el tipo de ingreso? Llegue a una
conclusin altamente significativa. * ep = 6.11 Aceptar Ho
38.- Los siguientes datos corresponden a los puntajes obtenidos por los alumnos de una
universidad. Con una probabilidad de 0,90
Puntajes N de estudiantes
< 30 14
30-35 18
35-40 22
40-45 20
45-50 40
50 28
Obtener una conclusin altamente significativa.
* ep = 243.29 Rechazar Ho
Seccin : Notas
A : 85 78 90 79 92 88
B : 66 75 72 81
C : 59 50 66 70 62 72 65
D : 61 71 69 80 75
Se puede concluir que la seccin A difiere de las dems secciones en cuanto a sus
notas? Obtenga una decisin significativa. ep = 11.60 Rechazar Ho
42.- Disponemos de un lote de dispositivos electrnicos, cada uno de los cuales consta de
seis circuitos, observndose el siguiente nmero de defectos en cada dispositivo
electrnico.
N de circuitos defectuosos : 0 1 2 3 4 5 6
N de dispositivos : 49 153 148 50 95 86 98
Aproximar los datos a una distribucin conocida, con un nivel de 0.01.
44.- Se propone que el nmero de defectos en las tarjetas de circuito impreso sigue una
distribucin Poisson. Se rene una muestra aleatoria de 60 tarjetas de circuito
impreso y se observa el nmero de defectos. Los resultados obtenidos son los
siguientes:
N de defectos : 0 1 2 3
Frecuencia : 32 15 19 14
Con una confianza del 95%, Podemos afirmar que la distribucin de los defectos en
las tarjetas de circuito impreso es Poisson?
45.- Tres proveedores diferentes proporcionan piezas en lotes de 500. Para comparar la
calidad de los lotes se toman muestras aleatorias de seis lotes de cada proveedor y se
examinan para determinar el nmero de piezas no conformes. Los resultados se
muestran a continuacin:
Proveedor:
A : 28 37 34 29 31 33
B : 22 27 29 20 18 30
C : 33 29 39 33 37 38
Podemos afirmar que el nmero medio de piezas no conformes por lote no es la
misma para los tres proveedores? ep = 10.45 p = 0.001
Frecuencia Graduados
Postgrado Secundaria Primaria
de Lectura Universit.
Nunca 7 14 13 16
Algunas veces 13 17 7 7
Matut. o Vesper. 39 41 10 5
Ambas ediciones 22 23 8 12
En el nivel de significancia de 0.10, A qu conclusin llegar el editor?
ep = 30.76 rechazar Ho
47.- A una muestra aleatoria de seis profesores auxiliares, cuatro profesores asociados y
cinco profesores principales se les propuso que hicieran una estimacin del tiempo
que haban dedicado la ltima semana a preparar sus clases. Los resultados, en
horas, fueron los siguientes:
Categora Tiempo
Auxiliar 7 12 11 15 9 14
Asociado 15 12 15 8
Principal 11 7 6 9 7
El decano cree que no existe diferencia significativa entre la cantidad de tiempo
empleado por los profesores para preparar sus clases, Cree usted que est en lo
correcto? ep = 0.92 aceptar Ho
50.- Un partido poltico desea conocer si existe relacin entre el grado de aceptacin de su
programa electoral y el sueldo de los electores ((en soles). Para ello selecciona al azar
a 50 personas y obtiene los siguientes resultados.
Aceptara el partido poltico que el sueldo medio de los electores explica el grado de
aceptacin del programa electoral a un nivel de confianza del 95%.
ep=3.24 Rechazar Ho
52.- Los nmeros que siguen son las prdidas de peso de ciertas partes de una mquina
debidas a la friccin, en miligramos, donde se utilizaron con tres lubricantes
diferentes.
Lubric. Prdidas de peso (miligramos)
X : 12 11 7 13 9 11 12 9
Y : 8 10 7 5 6 10 7 8 11 7
Z : 9 3 7 8 4 6 6 5
Podemos afirmar que las diferencias entre las tres medias de las muestras se
pueden atribuir al azar? ep = 10.58 P = 0.001
53.- Los siguientes datos corresponden a una muestra tomada al azar de 100 personas,
obtenindose los resultados que se indican:
Hombres Mujeres
Fumadores 30 10
No fumadores 20 40
54.- Una agencia de empleos desea saber cul es ms efectivo de tres tipos de anuncios
en la seccin de avisos clasificados de un peridico local. Durante varias semanas se
alternaron de manera aleatoria los tres tipos de anuncios (con encabezado grande,
normal, o con letra especial), registrndose semanalmente el nmero de personas
que respondan a los anuncios.
N de personas que respondieron
Encabezado grande : 23 42 36 48 33 26
Normal : 19 31 18 24 26
Con letra especial : 28 33 46 29 34 34
Podemos afirmar que no hay diferencia en la efectividad de los anuncios, tomando
como base el nmero medio de respuestas? ep = 3.73 aceptar Ho
55.- Se obtuvo una muestra de 270 diskettes de cierta marca que pueden poseer errores
clasificados en distintos tipos.
Tipo de error : 0 1 2 3 4
Frecuencia : 46 96 85 35 8
Se quiere averiguar si la variable aleatoria tipo de error, sigue una distribucin
Binomial. Con un 5% de riesgo de equivocarnos.
56.- Seis monedas fueron lanzadas muchas veces. Las frecuencias de los nmeros de
caras se dan a continuacin:
Nmero de caras 0 1 2 3 4 5 6
Frecuencias 48 120 285 324 312 145 58
Con una confianza del 99%, verifica si los datos se ajustan a un modelo binomial.
ep = 123.24 rechazar Ho
57.- El fabricante de una bebida baja en caloras est considerando la importancia del
color del envase rojo, amarillo o azul- en las ventas de la bebida. Para ello elige 15
tiendas ms o menos del mismo tamao, y lleva envases rojos a seis de las tiendas,
amarillos a cinco y azules a las cinco restantes. Despus de unos cuantos das, se
anotan las ventas (en decenas de latas) en las diferentes tiendas, obtenindose los
siguientes resultados:
Color del envase:
Rojo : 43 52 59 76 61 81
Amarillo : 52 37 38 64 74
Azul : 61 29 38 53
Podemos afirmar que las diferencias que se encuentren entre los promedios de los
tres envases no son significativas y se deben slo al azar?
ep = 1.54 P = 0.254
58.- Supngase que deseamos decidir, sobre la base de los datos que se muestran en la
siguiente tabla, si el nmero de errores que comete un tipgrafo al elaborar una
galera de texto es una variable aleatoria que tiene una distribucin de Poisson.
N de errores 0 1 2 3 4 5 6 7 8 9
Frecuencias 18 53 103 107 82 46 18 10 2 1
Realizar dicha prueba, con un nivel del 10%. ep = 6 Aceptar Ho
59.- Un investigador opina que las calificaciones que consiguen los estudiantes
universitarios dependen del tiempo que dediquen a escuchar msica. Con el objeto
de probar su teora, ha aplicado aleatoriamente un cuestionario a 400 alumnos. El
cuestionario contiene dos preguntas: "cuntas horas por semana escucha usted
msica?" y "cul es su calificacin promedio en todos los cursos?". Los datos de la
encuesta se incluyen en la tabla siguiente.
Puntajes
Mquina mecnica 70 58 62 56 65 49
Mquina elctrica 62 78 48 63 55 51
Computadora 52 60 47 48 52 40
Hay evidencia suficiente para concluir que existe una diferencia entre las medias
poblacionales de los tres tipos de mquinas? Recomendaras en especial una de las
tres mquinas? * ep = 2.75 aceptar Ho
61.- Una muestra al azar de sujetos lee 1, 3 y 5 veces una lista de palabras que deben
memorizar. Tras cada lectura se les pasa una tarea de recuerdo. Sus aciertos fueron:
N de partculas Frecuencia
5- 9 1
10-18 10
19-24 37
25-30 36
31-36 13
37-43 2
44-50 1
Probar si los datos pueden considerarse como una muestra tomada al azar de una
poblacin normal. ep = 2.97 aceptar Ho
64.- En un estudio acerca del nmero de clientes esperando turno para ser atendidos en
la caja de una tienda de autoservicios, se eligieron al azar intervalos no superpuestos
de 5 minutos cada uno. Los resultados se muestran a continuacin:
N de clientes : 0 1 2 3 4 ms
N de intervalos : 8 20 25 18 9
Realizar la prueba de bondad de ajuste ms apropiada, para un nivel del 1%
ep = 2.77 aceptar Ho
65.- Se cree que el nmero de erratas por pgina de un determinado libro sigue una
distribucin de Poisson. Elegida una muestra aleatoria simple de pginas del
mencionado libro se obtuvo la siguiente distribucin de frecuencias absolutas sobre
dicho nmero de erratas por pgina.
N de erratas : 0 1 2 3 4 5
N de pginas : 35 72 68 48 17 6
Obtener una decisin altamente significativa. ep = 2.22 aceptar Ho
66.- En una empresa se escogi a un grupo de empleados al azar; para que en uno de
cuatro grupos de entrenamiento, aprendieran a ejecutar una tarea en una lnea de
ensamble. Los grupos eran diferentes respecto de la cantidad de instruccin que
haban recibido. Al terminar el periodo de entrenamiento, cada uno de los empleados
realiz la tarea. Se hizo un registro del tiempo (en minutos) que necesitaron para la
realizacin completa de la tarea y se obtuvieron los siguientes resultados:
A : 51 42 44 65 49
B : 60 65 82 56 40 12
C : 80 75 98 23
D : 53 50 45 50 45
El Jefe de Personal quiere saber si existe diferencia significativa entre el tiempo
promedio necesitado por cada uno de los empleados
Si tuvieras que adoptar uno de estos planes, sabiendo que cometer un error tipo I
sera muy grave, qu plan adoptaras? Por qu?
N de descomposturas : 0 1 2 3 4 5 6 7 8 9
N de horas : 6 8 12 18 10 9 7 8 5 1
Con un nivel de significancia del 2.5%, podemos ajustar los datos a una
distribucin conocida?
70.- Se realiza una investigacin para determinar si hay alguna asociacin entre el peso
de un estudiante y un xito precoz en la escuela, a juicio de un psiclogo escolar. Se
selecciona una muestra aleatoria consistente en 500 estudiantes. Se clasifica a cada
estudiante de acuerdo con dos criterios, el peso y el xito en la escuela. La tabla de
contingencia generada es la siguiente:
Con sobrepeso Sin sobrepeso
xito 162 263
Fracaso 38 37
Se puede concluir que hay una alta asociacin entre ambas variables?
71.- El control de calidad de una determinada pieza se realiza a travs de tres pruebas,
considerndose que los resultados proporcionados por las tres pruebas son
igualmente significativos. Para contrastar dicha hiptesis, con un nivel del 1%, se
seleccionan tres muestras, las cuales dan los siguientes resultados:
Prueba 1 23 70 50 58 64 73
Prueba 2 36 50 43 32 71 55 61 29 42 60
Prueba 3 56 58 40 31 63
A la vista de estas observaciones, puede afirmarse que las tres pruebas aportan
resultados similares? ep = 0.60 Aceptar Ho
73.- Una cadena de grandes almacenes tiene cinco divisiones, una en cada piso. De una
muestra aleatoria de clientes se obtuvo la siguiente clasificacin:
Divisin de compra
Tipo de pago Ropa y Cosmtica Muebles y Regalos
Juguetes
calzado y belleza electrodomsticos y joyas
Al contado (billetes) 80 30 10 10 90
Al contado (cheque) 100 90 30 20 60
Tarjeta de crdito 140 150 50 40 100
Se puede concluir que el tipo de pago est altamente asociado con la divisin de
compra? Por qu? ep = 59.46 Rechazar Ho
74.- Una fbrica de automviles quiere averiguar si el gnero de sus posibles clientes
tiene algo que ver con la preferencia de modelo. Se toma una muestra aleatoria de
posibles clientes y se obtiene los siguientes resultados:
Modelo
Gnero
A B C
Femenino 340 400 260
Masculino 350 270 380
78.- Disponemos de una muestra de 250 mujeres mayores de 18 aos, cuyos pesos son
los presentados en la tabla adjunta:
Pesos : 30-40 40-50 50-60 60-70 70-80 80-90 90-100 100-110
N Mujeres : 16 18 22 51 62 55 22 4
Se quiere saber si los datos de esta muestra provienen de una distribucin Normal.
79.- Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro
procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente
se les realiza una prueba de recuerdo de dichas palabras, obtenindose los
siguientes resultados:
Procedimiento
I : 5 7 6 3 9 7 4 2
II : 9 11 8 7 7
III : 8 6 9 5 7 4 4
IV : 1 3 4 5 1 4
Si se sabe que los procedimientos son homocedsticos, se puede afirmar que el
procedimiento IV difiere de los otros procedimientos? Por qu? Usar un nivel del
1%.
82.- En el transcurso de dos horas, el nmero de llamadas por minuto solicitadas a una
central telefnica fue:
N llamadas/min : 0 1 2 3 4 5 6
Frecuencia : 6 18 32 35 17 10 2
Se puede aceptar, al nivel del 5%, que el nmero de llamadas por minuto sigue una
distribucin de Poisson?
84.- Se desea estudiar el nmero de accidentes por da que se producen en una gran
empresa. Para ello se toman al azar los partes de 200 das dentro de los cinco
ltimos aos, encontrando los siguientes resultados:
N accidentes/da : 0 1 2 3 4 5 6
N de das : 58 75 44 18 3 1 1
Se puede aceptar, con una confianza del 90%, que el nmero de accidentes por da
sigue una distribucin de Poisson?
85.- Se ha realizado una encuesta en una ciudad con objeto de estudiar las posibles
relaciones entre el nivel educativo (superior, secundaria o primaria) de las personas
y el nivel de consumo (bajo, medio o alto) de cierto producto. Los resultados para
400 personas seleccionadas al azar, han sido:
Nivel de consumo
Nivel educativo
Bajo Medio Alto
Superior 31 41 44
Secundaria 28 79 125
Primaria 16 17 19
Obtener una conclusin altamente significativa.
% celulosa
5 : 7 8 15 11 9 10
10 : 12 17 13 18 19 15
15 : 14 18 19 17 16 18
20 : 19 25 22 23 18 20
A qu conclusin altamente significativa llegar el jefe de produccin?
87.- Nos dicen que un programa de ordenador genera observaciones de una distribucin
N (0 ,1 ) . Como no estamos seguros de ello, obtenemos una muestra aleatoria de 450
observaciones mediante dicho programa, obtenindose los siguientes resultados:
Componentes
Distribuidor
defectuosos correctos
1 16 94
2 24 76
3 9 81
Obtener una conclusin altamente significativa.
91.- Se han aplicado cuatro mtodos distintos para el aprendizaje del concepto de
nmero primo a cuatro grupos de alumnos y alumnas elegidos aleatoriamente.
Posteriormente se les ha pasado la misma prueba para valorar la adquisicin del
concepto, con los siguientes resultados:
Mtodo
A : 8 12 11 15 7 9 10 11 17 12
B : 16 12 13 15 19 16 13
C : 16 15 13 17 13 9 19 16 14
D : 11 9 8 8 9 12 10 9
Se supone poblacin normal y que las muestras son independientes entre s. Hay
alguna evidencia, al 95% de confianza, de que exista un efecto en la aplicacin de los
distintos mtodos?
93.- Para estudiar el efecto del cansancio en una tarea rutinaria, se han contado el
nmero de realizaciones de varios operarios a lo largo del da, con estos resultados:
Al inicio del trabajo : 12 12 13 14 11 15 9 8
A las 4 horas : 9 9 8 7 6 5 12 11 8
A las 7 horas : 7 6 8 9 9 7 8
Se puede afirmar que el tiempo de trabajo transcurrido influye en el rendimiento?
95.- En una empresa de montaje trabajan 135 operarios que realizan un determinado
trabajo (T). La direccin de la empresa est interesada en conocer si influye el factor
operario en la variable tiempo de realizacin del trabajo T. Para ello se eligen
operarios al azar y se les controla el tiempo en minutos que tardan en realizar el
trabajo T. Los resultados del experimento son los siguientes.
Operario
1 : 72 75 71 69 67 71 75 73 69
2 : 75 70 77 73 79 77 72 78
3 : 78 79 84 72 83 77 80 83 71 85
4 : 69 65 61 75 70 68 67
5 : 65 60 63 68 70 64 62 64 69 62
Difieren los operarios en cuanto al tiempo de realizacin del trabajo?
97.- Se hizo un estudio para determinar el efecto del tipo de almacenaje (1: plstico
compacto, 2: plstico tejido, 3: papel y 4: camo) en el contenido de humedad del
arroz.
Tipo de almacenaje Contenido de humedad
Plstico compacto : 57 26 39 23 48 50
Plstico tejido : 67 44 57 74 61 68
Papel : 95 92 91 105 77 88
Camo : 102 96 102 103 99 117
Se puede concluir que los tipos de almacenaje difieren en cuanto a su contenido de
humedad? Usar un nivel del 10%. ep = 44.58 Rechazar Ho
Presencial : 90 85 78 82 94 75 82
Internet : 65 64 72 60 52 84 64 72 63 60
Autodidacta : 78 84 92 74 68 76 70 84
Cul de los tres mtodos recomendaras utilizar? Por qu? Obtener una conclusin
altamente significativa.
Electricistas : 74 65 72 69 66 65 68
Carpinteros : 75 78 74 76 72 76 75 77 74 78
Pintores : 56 55 53 52 56 57 55 54
Probar si los salarios medios de estas tres categoras de trabajadores difieren
significativamente.