You are on page 1of 22

Medidas de tendencia central Datos no agrupados Poblacin: Media M = Xi N Muestra: x = Xi n

Moda

x valor ms frecuente

x valor ms frecuente

Mediana

x nones. Ordenar los nmeros que segn su valor y encontrar el que queda en el medio

Marca de clase:

Se suman el lmite inferior y el lmite superior, se obtiene x y esa es la marca de clase.

Medidas de dispersin Datos no agrupados Poblacin: Varianza 2 = (Mi-M)2 N = 2 Muestra: S2 = (xi-x)2 n-1 S = S2

Desviacin estndar

Coeficiente de variabilidad:

(100) M

Distribucin Normal Estndar En 1733, Moivre la descubri. En 1812, Laplace estudi esta distribucin. En 1809 Karl Gauss le dio el impulso ms fuerte a la Distribucin Normal de Probabilidad. Se le conoce tambin como Distribucin Laplace-Gauss. Es una distribucin de probabilidad continua, que ocupa un lugar preponderante en la estadstica, porque tiene algunas propiedades que la hacen aplicable a un gran nmero de situaciones en las que es necesario hacer inferencia mediante la toma de muestras.

Caractersticas: 1. Es simtrica. 2. Tiene forma de campana 3. La media, la moda y la mediana tienen la misma posicin: el centro. 4. Est definida por 2 parmetros: la media y la desviacin estndar (distancia entre la media y cualquier punto de la distribucin). 5. El rea bajo la curva suma 1. 6. El rea total es la unidad y se relaciona con probabilidad del 100%, la mitad sera .5 en trminos de rea y 50% en trminos de porcentaje. 7. Es asinttica, sus extremos nunca tocan el piso. 8. Tiene media 0 y desviacin estndar 1. 9. Tiene un estndar, que es la variable Z 10. Estandarizada, la media vale 0. 11. La media + 1 = 68% de la poblacin. 12. La media + 2 = 95% de la poblacin 13. La media + 3 = 99% de la poblacin Ejercicio 1 El profesor A en promedio sus estudiantes tienen 8, con una desviacin estndar de 2 y una media poblacional de 9. Datos: x = 8, = 2 Z=xM M=9 Z =89 2 1 2 Z = .5 Z = 0.1915

x Moda Mediana

.5 50%

.5 50%

68% 95% 99%

1 100%

El profesor B en promedio sus estudiantes tienen 8, con una desviacin estndar de 10 y una media poblacional de 8 Datos: x = 8, = 10 Z =88 10 M=8 0 10 Z=0 Z = 0.0000

Conclusin: el grupo B est mejor que el A, porque no hay variacin con respecto a la media.

Ejercicio 2

Se va a impartir un curso de Neurolingstica. Los antecedentes son que en cursos anteriores la duracin fue de 70 horas en promedio, con una desviacin estndar de 10. a) Cul es la probabilidad de que un participante dure menos de 70 horas en completar su programa Respuesta = 50%

Menos de 70

70

b) Cul es la probabilidad de que un participante elegido al azar dure 75 horas en completar su programa? Z=xM Z = 75 70 = 5 = .5 10 10

Z = 0.1915
19.15%

Respuesta = 19.15% de probabilidad

70 75

c) Cul es la probabilidad de que un participante dure entre 60 y 80 horas en completar su programa? Z=xM Z=xM Z = 60 70 = - 10 = -1 10 10 Z = 80 70 = 10 = 1 10 10 Z = 0.3413 Respuesta = 68.26% de probabilidad Z = 0.3413 Z Total =0 .6826

60 70 80

MUESTREO En estadstica se conoce como muestreo a la tcnica para la seleccin de una muestra a partir de una poblacin. Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a la poblacin. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzaran si se realizase una investigacin de toda la poblacin. Para que el muestreo sea vlido y se pueda realizar un estudio adecuado hay que hacer estimaciones de la poblacin y estimar tambin los mrgenes de error correspondientes a dichas estimaciones. Nunca podremos estar enteramente seguros de que el resultado sea una muestra representativa, pero s podemos actuar de manera que esta condicin se alcance con una probabilidad alta. En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la poblacin, se puede extraer dos o ms muestras de la misma poblacin. Al conjunto de muestras que se pueden obtener de la poblacin se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extraccin, sigue la llamada distribucin muestral. Muestreo Probabilstico La definicin de una muestra de tipo probabilstico requiere determinar el tamao de la muestra y seleccionar los elementos muestrales de manera que todos tengan la misma posibilidad de ser elegidos. Muestreo Aleatorio Simple La seleccin de los elementos que componen la muestra es al azar, por lo que las preferencias y deseos del sujeto no influyen en este proceso. Caractersticas: Cualquier elemento de la poblacin puede ser seleccionado. Es costoso. Se aplica en poblaciones heterogneas. Necesita una tabla de nmeros aleatorios

Muestreo aleatorio sistemtico Se ajusta a patrones sistemticos de tiempo, orden, espacio. Por ejemplo: Orden: cada n veces (n = cualquier nmero natural mayor de 1). Espacio: Texcoco, cierta calle, cada n casas Tiempo: cada n minutos. Tiene un menor costo, pero un mayor margen de error. Muestreo estratificado Dividimos la poblacin en porciones o estratos. A cada estrato aplicamos proporcionalmente el nmero de muestras respecto al tamao de la poblacin. No es costoso. Se considera el tipo de muestreo ms importante que hay en cualquier ciencia porque da una informacin ms confiable respecto de la poblacin.

Muestreo por conglomerados (racimos, grupos) Su ventaja principal es el ahorro de recursos en tiempo, costos y energa, al considerar que muchas veces los elementos muestrales se encuentran encapsulados en determinados lugares fsicos o geogrficos, a los que denominados racimos o conglomerados. Caractersticas: Es aplicable para poblaciones muy grandes cuando el territorio es extenso. A cada conglomerado se le puede aplicar un aleatorio simple o un sistemtico. Entre un conglomerado y otro existe mucha variacin, pero dentro de cada conglomerado hay poca variacin. Por ejemplo: entre Texcoco, Tlalnepantla y Toluca existe mucha variacin, dentro de la zona de Texcoco, existe poca variacin. TAMAO DE LA MUESTRA Existen dos frmulas para obtener el tamao de la muestra: POBLACIN FINITA Menos de 500,000 datos n = Z2 Npq i2 (N-1) + Z2 p q POBLACIN INFINITA Ms de 500,000 datos n = Z2 p q i2 n = (Z S)2 i2 Donde:
N= n= Z= Poblacin o universo. Es el conjunto de todos los elementos que concuerdan con una serie determinada de especificaciones, todos los elementos que son objeto del estudio estadstico Muestra. Es un subconjunto extrado de toda la poblacin mediante tcnicas de muestreo, cuyo estudio sirve para inferir caractersticas de toda la poblacin. Distribucin normal de probabilidad. Nivel de confianza (90%, 95% y 99%) Valores de Z: Confianza Equivalente Error 90% 1.64 10% 95% 1.96 5% 99% 2.58 1% Probabilidad de que suceda. Este valor se expresa en porcentaje, quiere decir: del 100% de la poblacin qu cantidad es susceptible que incurra en la situacin estudiada. Para conocer este valor existen tres alternativas: 1. Si se trata de un producto, el porcentaje de participacin de mercado dar la probabilidad de que suceda. 2. Existen estudios de tendencias que permiten obtener dicha informacin. 3. Si no tenemos acceso a ninguna de las dos fuentes anteriores, se coloca 50%. Probabilidad de que no suceda. La suma de factores entre la probabilidad de que suceda y la probabilidad de que no suceda un evento debe ser igual a 100%; por ello, si conocemos uno de los dos porcentajes es posible determinar el otro. Por ejemplo: si p es 35%, q ser 65%. Error. El mximo error permisible en una investigacin es del 10%. Un estudio que exceda de este porcentaje estar fuera de los parmetros aceptables. Desviacin estndar de la poblacin.

p=

q=

i= S=

EJERCICIO

En UVM, con un total de 600 alumnos de la licenciatura en Derecho, en todos los turnos, se quiere determinar el tamao de la muestra con un nivel de confianza del 90% N = 60 p = 50% = .5 q = 50% = .5 Z = 1.64 i = 10% = .1 n = (1.64)2 (600) (.5) (.5) (.1) (600-1) + 1.642 (.5) (.5)
2

n =2.6896

(600) (.25) .01 (599) + 2.6896 (.25) 150 = 2.6896 150 5.99 + .6724 6.6624

n = 2.6896

n = (2.6896) (22.51) = 60.54 n = 60 sujetos Si queremos aumentar el nivel de confianza al 95%, cul ser el resultado? N = 60 p = 50% = .5 q = 50% = .5 Z = 1.96 i = 5% = .05 n = (1.96)2 (600) (.5) (.5) (.05) (600-1) + 1.962 (.5) (.5)
2

n =3.8416

(600) (.25) .0025 (599) + 3.8416 (.25) 150 n= 3.8416 150 1.4975 + .9604 2.4579 n = 234 sujetos

n = 3.8416

n = (3.8416) (61.02) = 234.41

Una vez que determinamos la forma de obtener la muestra y el tamao de la muestra, procedemos a hacer el anlisis de los datos estadsticos. La inferencia de los estadsticos muestrales sobre los parmetros poblacionales es una estimacin del comportamiento de la poblacin total. A partir de los datos obtenidos en la muestra vamos a determinar cmo se comporta la poblacin. La x de la muestra determina la M poblacional. La S2 de la muestra determina la 2 poblacional. La S de la muestra determina la poblacional. DISTRIBUCIN MUESTRAL Qu es una distribucin muestral? Es un estadstico que proporciona: 1) Una lista de todos los valores que puede asumir dicho estadstico. 2) La probabilidad de obtener cada valor, suponiendo que este es producto del azar.

El parmetro caracteriza a la poblacin El estadstico caracteriza a la muestra Caracterizar: describir, decir algo de. A cada muestra le vamos a determinar un estadstico muestras (media, varianza, desviacin estndar, mediana, etc.) N = Poblacin N = A, B, C Posibles muestras: Muestra AB AC BC Estadstico x1 x2 x3 x1 x2 x3 1.- AB 2.- AC 3.- BC n = muestra N>n

La distribucin en el muestreo del estadstico media muestral es = Cada muestra tiene un valor.

ERROR ESTNDAR Existe error porque nos basamos en la muestra en vez de en la poblacin total. El error estndar es la desviacin estndar de una distribucin en el muestreo de un estadstico. El error de muestreo es la diferencia que hay entre los valores del parmetro poblacional y el estadstico muestral. Error de muestreo = M x Cmo medimos el error de muestreo? Se mide a travs del error estndar. Para qu me sirve o que me indica el error de muestreo? Sirve para saber la precisin. A menor error, mayor precisin. Frmula del error muestral x = n

ESTIMACIN

Es el proceso de utilizar un estadstico muestral para estimar el parmetro poblacional correspondiente. El proceso de inferencia estadstica puede tomar una de las dos formas siguientes: a) Estimacin b) Pruebas de hiptesis a) Estimacin 1. Estimacin puntual. Es cuando un solo valor determina o estima el valor del parmetro poblacional. Este solo valor lo obtenemos a travs de la muestra y se puede decir que es el verdadero valor, el valor real, porque lo obtuvimos a travs de la muestra. Ejemplo: media o promedio. 2. Estimacin de intervalo. Es el error estndar de la media + la media muestral. Est formado por dos valores: un lmite inferior y un lmite superior. EJERCICIO El director de un centro de investigacin psicolgica necesita conocer cul es la vida promedio de un alcohlico que tiene un alto nivel del problema de alcoholismo. Para realizar esta investigacin, se hace un muestreo aleatorio de 200 personas que tienen, segn proyeccin, una vida promedio de 36 aos. Estimacin puntual = 36 aos de vida promedio El director nos pide que demos una explicacin de la incertidumbre que acompaa a la estimacin puntual. Para dar una respuesta fundamentada tcnicamente, tenemos que determinar el error de muestreo. = 10 x = n 10 200 10 14.14 x = .707 36 + .707

Intervalo: [35.293 - 36.707] Lmite inferior: 35 aos, 3 meses y 15 das Lmite superior: 36 aos, 8 meses y 14 das. Esto resulta de utilidad para el Director, pero no es informacin suficiente para la investigacin. Necesitamos calcular la posibilidad de que la duracin de la vida los alcohlicos est en este intervalo o en otros intervalos de diferente ancho que podamos escoger. La probabilidad de que el verdadero valor del parmetro de la poblacin est dentro de la estimacin de intervalo, se determina de la siguiente forma:

68% 95% 99%

x + 1 = 68% x + 2 = 95% x + 3 = 99%

[36 + 1 (.707)] [36 + 2 (.707)] [36 + 3 (.707)]

[36 + .707] [36 + 1.41] [36 + 2.12]

[35.3 a 36.8] = 68% [34.5 a 37.4] = 95% [33.8 a 38.1] = 99%

Al usar estimaciones de intervalo, nos quedamos nicamente a + 1, 2 3 desviaciones estndar (errores estndar) Para dar una respuesta con mayor fundamento probabilstico, debemos realizar estimaciones de intervalo e intervalos de confianza. En Mtodos cuantitativos, la probabilidad que asociamos con una estimacin de intervalo se conoce como el nivel de confianza que indica la confianza que tenemos que la estimacin de intervalo incluya al parmetro de poblacin. La confianza es la precisin de nuestro trabajo [x + 1.64 (x)] = 90% [x + 1.96 (x)] = 95% [x + 2.58 (x)] = 99% [36 + 1.64 (.707)] [36 + 1.96 (.707)] [36 + 2.58 (.707)] [36 + 1.15] [34.85 a 37.15] = 90% [36 + 1.38] [34.62 a 37.38] = 95% [36 + 1.82] [34.18 a 37.82] = 99%

b) Pruebas de hiptesis Hiptesis: suposicin o afirmacin sobre algo. Es una suposicin acerca de un parmetro de la poblacin, que se desarrolla con el propsito de realizar pruebas. La prueba de hiptesis es el proceso para probar la significancia de la diferencia entre un estadstico muestral y el correspondiente parmetro poblacional hipottico. Para probar una hiptesis necesitamos una distribucin terica de probabilidad. La prueba de hiptesis es un procedimiento que se basa en la evidencia de las muestras y en la teora de la probabilidad para determinar si la hiptesis es un enunciado razonable.

PROCEDIMIENTO DE CINCO PASOS PARA PROBAR UNA HIPTESIS 1. Plantear la hiptesis nula (Ho) y la hiptesis alternativa (Ha). La hiptesis nula (Ho) es una afirmacin respecto del valor de un parmetro de la poblacin. Siempre lleva la igualdad (=). Ejemplo: Ho: M = 9 La hiptesis alternativa (Ha) es una afirmacin que se acepta si los datos de la muestra proporcionan evidencias suficientes de que la hiptesis nula es falsa. Lleva los signos > y < (mayor que y menor que) 2. Seleccionar un nivel de significancia. El nivel de significancia () es la probabilidad de rechazar la hiptesis nula cuando no es verdadera Error tipo I (). Rechazar la hiptesis nula cuando es verdadera Error tipo II (). Aceptar la hiptesis nula cuando es falsa. 3. Calcular el estadstico de prueba (Z, t, Fn, X2). El estadstico de prueba es un valor que se calcula con base en la informacin de la muestra y que se utiliza para determinar si se rechaza la hiptesis nula. En la prueba de hiptesis vamos a comparar el estadstico de prueba con el estadstico de tablas. El estadstico de prueba es un valor que se calcula con base en la informacin de la muestra y que se utiliza para determinar si se acepta o se rechaza la hiptesis nula. 4. Formular la regla de decisin. La regla de decisin es una afirmacin de las condiciones bajo las que se rechaza la hiptesis nula y bajo las que no se rechaza. Valor crtico. Punto de divisin entre la regin en que se rechaza la hiptesis nula y la regin en la que no se rechaza. 5. Tomar una decisin. Tomar la decisin de rechazar o no rechazar la hiptesis nula, en base al valor del estadstico de prueba y al valor crtico.
CONDICIN PARA USAR LAS DISTRIBUCIONES NORMAL Y t DE STUDENT 2 EN LA PRUEBA DE HIPTESIS, RESPECTO A LAS MEDIAS/ /

El tamao de la muestra n es mayor (>) que 30 datos El tamao de la muestra n es menor o igual () que 30 datos y suponemos que la poblacin es normal o aproximadamente normal Z=xM n

Cuando se conoce la distribucin estndar de la poblacin Distribucin normal de probabilidad. Tabla z

Cuando no se conoce la distribucin estndar de la poblacin Distribucin normal de probabilidad. Tabla z Distribucin t de student

Distribucin normal de probabilidad. Tabla z

t = x M s n

= Desviacin estndar poblacional s = Desviacin estndar de la muestra

Prueba de un extremo Se puede resolver por los datos originales o los datos estandarizados. EJERCICIO PRUEBA DE UN EXTREMO En un hospital psiquitrico se usan grandes cantidades de dosis envasadas de un medicamento. La dosis individual tiene una medida en promedio de 100 cm 3. La accin del medicamento es que el cuerpo tolerar sin dao alguno dosis excesivas; dosis insuficientes no producen el efecto mdico deseado. El hospital ha adquirido este medicamento al mismo fabricante durante varios aos y sabe que la desviacin estndar de las dosis es de 2 cm3. Antes de comprar el medicamento, el hospital realiza un muestreo aleatorio de 50 dosis, donde encuentra que la media es de 99.75 cm3. Se prueba la hiptesis con un nivel de significancia del 10% y se nos pregunta si compramos o no compramos el medicamento. MHo = 100 cm3 = 2 cm3 n = 50 dosis x = 99.75 = 10% = .1 MHo = Media hipotetizada = Desviacin estndar n = Muestra x = Media = Nivel de significancia o nivel crtico Ho: M = 100 cm3 Ha: M < 100 cm3 Vamos a utilizar la distribucin normal de muestreo (Z), porque es una muestra grande, mayor de 30 y nos vamos al extremo izquierdo, porque la media muestral (x) es menor que la media poblacional (M). x = n 2 50 99.75 100 .2828 2 7.07 - .25 .2828
.884 10% .1 -1.28

x = .2828 Zc = .884 Zt = 1.28

Zc = x MHo x

40% .4

0 100

50%

Se acepta la hiptesis nula, ya que .884 est entre 0 y -1.28. S se compra el medicamento.

EJERCICIO PRUEBA DE DOS EXTREMOS A un hospital psiquitrico donde se realizan investigaciones sobre problemas de comportamiento humano un fabricante suministra aparatos de medicin precisa. stos deben de medir 80,000 micras en pruebas de investigacin en neurologa. Un aparato excesivamente preciso eleva los costos de produccin de manera significativa. Por experiencia de los investigadores, se sabe que stos tienen una desviacin estndar de 4,000 micras. El fabricante, antes de licitar su producto, realiza un muestreo de 100 aparatos y encuentra que la precisin de stos es de 79,600 micras en promedio. ste utiliza un nivel de significancia del 5% para probar su hiptesis. El aparato rene o no las caractersticas? MHo = 80,000 micras = 4,000 micras n = 100 aparatos x = 79,600 micras = 5% = .05 MHo = Media hipotetizada = Desviacin estndar n = Muestra x = Media = Nivel de significancia o nivel crtico Ho: M = 80,000 micras Ha: M 80,000 micras Vamos a utilizar la distribucin normal de muestreo (Z), porque es una muestra grande, mayor de 30 y la vamos a probar con ambos extremos, porque la media muestral (x) es diferente que la media poblacional (M). En primer lugar, vamos a dividir el nivel de significancia entre 2, porque se hace la prueba con los dos extremos, y as tenemos un = .025, que es igual a Z 1.96 x = n 4,000 100 79,600 80,000 400 4,000 10 - 400 400 x = 400 Zc = -1 Siempre se requiere obtener el error de muestreo Zc = .3413

Zc = x M x

Zt = [MHo + Z (x)] [80,000 + (1.96) (400)] [80,000 + 784] [79,216 a 80,784]


79,600 .3413 2.5% .025 1.96 2.5% .025 1.96

79,216

0 80,000

80,784

Se acepta la hiptesis nula (Ho). S se compran los aparatos de medicin precisa, ya que 79,600 est situada entre el rango de 79,216 y 80,784.

EJERCICIO PRUEBA DE DOS EXTREMOS Datos: MHo = 0.04 = 0.004 n = 100 x = 0.0408 = 5% = .05 Ho: M = 0.04 Ha: M 0.04 En primer lugar, vamos a dividir el nivel de significancia entre 2, porque se hace la prueba con los dos extremos, y as tenemos un = .025 de cada lado, obteniendo una Z de 1.96 x = n 0.04 100 0.0408 0.04 0.0004 0.04 10 x = 0.0004 Zc = 0.4772

Zc = x M x

.0008 Zc = 2 0.0004

Zt = [MHo + Z (x)]

[0.04 + (1.96) (.0004)]

[0.04 + 0.000784] [0.039216 a 0.040784]

2.5% .025 1.96

2.5% .025 1.96 x 0.0408

0.039216

0 0.04

0.40784

Se rechaza la hiptesis nula (Ho), ya que la media muestral (x) queda fuera del rango del nivel crtico DISTRIBUCIN t DE STUDENT En muchas situaciones en psicologa no se conoce la desviacin estndar poblacional y el nmero de observaciones es menor o igual a 30. En estos casos se puede utilizar la desviacin estndar de la muestra para estimar la desviacin estndar poblacional. Caractersticas: La distribucin t de student es simtrica, parecida a la distribucin normal de probabilidad. La diferencia es que en los extremos es ms ancha y es plana en la parte superior. La zona de rechazo es ms amplia.

Z 10% = 1.64

10% = 2.13

Para Z un nivel de significancia () del 10% = 1.64, para t de student un nivel de significancia () del 10% = 2.13 Es una distribucin continua de probabilidad (significancia) que utiliza enteros y decimales. No hay una sola distribucin t de student, sino una familia, todas con la misma media con valor 0, pero con su respectiva desviacin estndar, diferente para cada t de student, de acuerdo al tamao de la muestra. La distribucin t es ms ancha y ms plana en el centro que la distribucin normal estndar; sin embargo, a medida que aumenta el tamao de la muestra, la distribucin t se aproxima a la distribucin normal estndar. La distribucin t tiene una mayor amplitud que la distribucin Z. Como resultado de ello, los valores crticos de t para un nivel de significancia en particular son de mayor magnitud que los valores crticos de Z. EJERCICIO PRUEBA DE UNA COLA O EXTREMO

Reclamo de una compaa aseguradora de gastos mdicos informa que el costo promedio de reclamo es de $60. Un comparativo mostr que tal cantidad era mayor. Para dar solucin a este problema, se seleccion una muestra aleatoria de 26 reclamos y se encontr que la media para esta fue de $57, con una desviacin estndar de $10. Con un nivel de significancia del 1%, probar si las medidas de recorte de gastos en realidad reducen el costo. MHo = $60 n = 26 x = $57 S = $10 = 1% = .01 Ho: M 60 Ha: M < 60

La prueba es de una cola o un extremo, porque se desea determinar si ha habido una reduccin de costo. La desigualdad de la hiptesis alternativa (Ha) seala la regin de rechazo en la cola izquierda de la distribucin t de student. La regla decisional nos indica que: si tc > tt, se rechaza la Ho si tc < tt, no se rechaza la Ho -3 1.961 tc = -1.525

tc = x M S n gl = n 1 gl = 26-1 = 25

57 - 60 10 26

-3 10 5.099

gl = grados de libertad tc = t calculada tt = t de tablas

Para obtener la tt hay que relacionar grados de libertad (gl) con la significancia () con el nmero de colas (1 2) Entonces: gl de 25, de .01 y nmero de colas 1 Dentro de la tabla, el nmero que se encuentra en la interseccin entre estos datos es 2.485

Nivel crtico

tt -2.485

tc -1.525

0 60

De acuerdo con la regla decisional establecida, no se rechaza la hiptesis nula (Ho), ya que la tc < que la tt. EJERCICIO PRUEBA DE DOS COLAS O EXTREMOS Datos: MHo = 43 = 2% = .02 x = 41.5 n = 12 S = 1.783 Ho: M = 43 Ha: M 43 La prueba es de dos extremos, porque la hiptesis alternativa (Ha) indica que la media poblacional es diferente () a 43.

La regla decisional indica que si tt est dentro del nivel crtico, la hiptesis nula (Ho) no se rechaza. Si tt est fuera del nivel crtico, la hiptesis nula (Ho) se rechaza. tc = x M S n gl = n 1 gl = 12-1 = 11 41.5 - 43 1.783 12 -1.5 1.783 3.464 -1.5 .514 tc = -2.918

gl = grados de libertad tc = t calculada tt = t de tablas

Para obtener la tt hay que relacionar grados de libertad (gl) con la significancia () con el nmero de colas (1 2) Entonces: gl de 12, de .02 y nmero de colas 2 Dentro de la tabla, el nmero que se encuentra en la interseccin entre estos datos es 2.718. Este es el nivel crtico, que est determinado por la t de tablas.

Nivel crtico

tc tt -2.918 -2.718

0 43

tt 2.718

tc 2.918

Se rechaza la hiptesis nula (Ho), porque la t calculada (tc) queda fuera del nivel crtico.

Prueba de Wilcoxon de rangos sealados y pares igualados para dos muestras dependientes
http://members.fortunecity.com/bucker4/estadistica/pruebawrspi2md.htm Este modelo estadstico corresponde a un equivalente de la prueba t de Student, pero se aplica en mediciones en escala ordinal para muestras dependientes. Cuando el tipo de medicin no cumpla con los requisitos que la prueba t de Student exige, la de Wilcoxon es una alternativa de aceptable eficacia para contrastar hiptesis. El mtodo es aplicable a muestras pequeas, siempre y cuando sean mayores que 6 y menores que 25. Las muestras grandes deben ser mayores a 25 y ste se debe transformar en valor de Z, para conocer la probabilidad de que aquella sea o no significativa.

Dicha prueba estadstica consiste en sumar los rangos de signo frecuente; por ello, no se tiene una ecuacin o frmula, como se observa en otras pruebas estadsticas. Se utiliza cuando:

Trabaja con datos de tipo ordinal. Establece diferencias de magnitudes (+ y -). Direccin.

Prueba de dos colas: No se sabe en qu direccin se pueden dar las diferencias. Prueba de una cola: S sabemos en qu direccin estn las diferencias. Dos muestras apareadas. Establece las diferencias . Con muestras grandes (> 25) se intenta lograr la distribucin normal (se utiliza la prueba Z).

Pasos: 1. Arreglar las observaciones pareadas y obtener las diferencias de cada pareja. 2. Arreglar las diferencias en funcin de rangos como valores absolutos, sin importar el signo, pero de manera que los rangos conserven el signo correspondiente a la diferencia. 3. Obtener la sumatoria de los rangos cuyo signo es el menos frecuente, por ejemplo: si el signo es +, se considerar para efectuar sumatorias; sin embargo, la sumatoria mencionada finalmente pierde el signo. 4. Si se trata de muestras pequeas, comparar el valor obtenido con los valores crticos de la tabla de Wilcoxon. 5. Distribuir las muestras mayores que 25 bajo la curva normal y, por tanto, calcular el valor Z, en referencia al cual se debe consultar la probabilidad de diferir con respecto al promedio en la tabla de probabilidades asociadas. 6. Decidir si se acepta o rechaza la hiptesis.

Ejemplo para muestras pequeas utilizando la prueba de dos colas: Un investigador desea comparar el grado de hiperactividad en obesos cuando estn en un programa para bajar de peso (dieta) y sin programa para bajar de peso. Eleccin de la prueba estadstica. Se tienen dos muestras dependientes y, por el tipo de medicin, es posible listarlas en una escala ordinal. Vase: Flujograma 3

Flujograma 3

Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Existe diferencia significativa entre el grado de hiperactividad en obesos cuando estn en un programa de dieta y sin el programa de dieta. Hiptesis nula (Ho). No existe diferencia significativa entre el grado de hiperactividad en obesos cuando estn en un programa de dieta y sin el programa de dieta, esto es debido al azar.

Nivel de significacin. Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho. Zona de rechazo. Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha. Aplicacin de la prueba estadstica. Con base a los pasos, se obtienen las diferencias observadas en los incrementos de hiperactividad en obesos, estando en un programa de dieta o no. Estos valores podrn tener signos positivos y negativos, los cuales quedaran abolidos al ordenarse los rangos y stos los adoptan.

Sumatoria de T = 15.5 El valor T de la prueba de Wilcoxon obtenido se compara con los valores crticos de la tabla T en pruebas de rangos sealados de pares iguales de Wilcoxon, y se puede apreciar que para ser significativo (es decir, por debajo de 0.05, que fue el nivel de significancia), requiere que este 0.05 sea menor; por lo tanto, la probabilidad es mayor que 0.05. tc = 15.5 tt = 8 Para dos colas = a = 0.05 N= 10 tc tt \ rechaza Ho Decisin. En virtud de que la probabilidad es mayor que 0.05, se acepta Ho y se rechaza Ha. Interpretacin. Las diferencias en el incremento o disminucin de la hiperactividad en personas obesas con dieta o sin dieta, no son significativas. Estadsticamente resultan iguales, en razn de que pueden ser diferencias dadas al azar.

Prueba de Wilcoxon para muestras grandes


Las muestras grandes que deben ser mayores a 25 se les debe transformar en valor Z. La frmula es: Donde: ZT = valor Z de la T de Wilcoxon. T = valor estadstico de Wilcoxon. T = promedio de la T de Wilcoxon. T = desviacin estndar de la T de Wilcoxon. Asimismo:

Donde: N = tamao de la muestra. Por otra parte:

Ejemplo para muestras grandes: Un investigador desea comparar el nivel de C.I. en jvenes universitarios del 1er semestre con el C.I. del los mismos universitarios cuando estn en 6to semestre. Eleccin de la prueba estadstica. El modelo experimental tiene dos muestras dependientes. Las mediciones no tienen una escala de intervalo, por lo que su ordenamiento se hace en escala ordinal. Vase: Flujograma 3 Planteamiento de la hiptesis.

Hiptesis alterna (Ha). El nivel de C.I. de los jvenes universitarios estando en 1er semestre es menor al que adquieren al estar en 6to semestre. Hiptesis nula (Ho). No habr diferencia en el nivel de C.I. de los jvenes universitarios estando en 1er semestre y cuando estn en 6to semestre.

Nivel de significacin. Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho. Zona de rechazo. Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha. Aplicacin de la prueba estadstica. Efectuar las diferencias entre los datos sobre le C.I. antes y despus, elaborar los rangos de las diferencias y hacer la sumatoria de los rangos de signo de menor frecuencia.

Sumatoria de T = 201.5 La sumatoria del valor T de Wilcoxon es igual a 201.5 y, como se especific en los pasos, ste se debe transformar en valor de Z, para conocer la probabilidad de que aquella sea o no significativa. Para ello debemos calcular primero el promedio y la desviacin estndar de la T de Wilcoxon.

Una vez calculados el promedio y la desviacin estndar del valor T de Wilcoxon, calculamos el valor Z.

El valor ZT calculado se localiza entre los valores Z de la distribucin normal de la tabla de probabilidades asociadas en valores extremos como los de 2 en la distribucin normal. En la interseccin de la hilera donde se encuentra el 0.6 y la columna 0.03, se puede observar la cifra 0.2643, la cual indica la probabilidad de que la magnitud de ZT difiera de T.

Decisin. La probabilidad de 0.2643 es mayor que 0.05, por lo cual se acepta Ho y se rechaza Ha. 0.2643 > 0.05 se rechaza Ha Interpretacin. No existe diferencia estadsticamente significativa entre el C.I. en jvenes estando en 1er semestre y cuando estn en 6to semestre.

You might also like