Professional Documents
Culture Documents
Pg.
PRUEBA DE INDEPENDENCIA................................................................................2
Ejemplo de Aplicacin...............................................................................................3
CORRECCIN DE YATES PARA TABLAS DE CONTINGENCIA DE 2X2...........4
Ejemplo de Aplicacin...............................................................................................5
Aspira a Carrera Tcnica.......................................................................................5
Total.......................................................................................................................5
PRUEBA DE HOMOGENEIDAD...............................................................................6
Ejemplo de Aplicacin...............................................................................................7
ANLISIS DE LA VARIANZA...................................................................................8
ANOVA con un factor.............................................................................................10
Observacin.........................................................................................................11
Especificacin del modelo.......................................................................................12
Observacin.........................................................................................................13
Algo de notacin relativa al modelo........................................................................14
Observacin.........................................................................................................16
RUTINA GENERAL DE UN ANLISIS DE VARIANZA.......................................18
Mtodo reducido para el anlisis de un factor.........................................................18
Anlisis de los resultados del ANOVA: Comparaciones mltiples.........................23
ANOVA de Varios Factores.....................................................................................24
IMPORTANCIA DEL SOFTWARE EN EL ANLISIS DE DATOS........................25
Software de Recoleccin de Datos..........................................................................26
Software de Anlisis................................................................................................28
BIBLIOGRAFA.........................................................................................................31
INTRODUCCIN
Existe una variedad de procedimiento para el procesamiento y anlisis
estadstico de datos, una vez recogidos los datos, procesados y convertidos en
informacin valiosa para el estudio que se realiza, pueden utilizarse varias tcnicas
que permitan sacar el mximo provecho de la informacin disponible, sin embargo,
la utilizacin de tcnicas de Estadstica No Parametricas son poco utilizada, a pesar
de la potencia y certeza de sus resultados, y que por lo general no se dispone de
informacin suficiente sobre la poblacin de la cual se extrajeron los datos que den
soporte la realizacin de inferencia con base en la muestra observada.
En esta investigacin se desarrollan algunas tcnicas de anlisis estadstico no
paramtrico tales como la prueba de independencia, la correccin de Yates en tablas
de contingencia de 2x2, las pruebas de homogeneidad y se hace un estudio sobre el
anlisis de varianza por medio de la tabla ANOVA, analizando la rutina general de
este tipo de anlisis, para terminar con comentarios sobre la importancia del software
en este tipo de anlisis.
PRUEBA DE INDEPENDENCIA
donde:
Ejemplo de Aplicacin
Para estudiar la dependencia entre la prctica de algn deporte y la depresin,
se seleccion una muestra aleatoria simple de 100 jvenes, con los siguientes
resultados:
Deportista
No deportista
Sin depresin
38
31
69
Con depresin
9
22
31
47
53
100
X
Y
Total
A
a
c
a+c
B
b
d
b+d
Total
a+b
c+d
n
Ejemplo de Aplicacin
En un estudio para determinar si existe relacin entre el sexo y el propsito de
elegir una carrera tcnica se entrevistaron a 120 aspirantes a la universidad. Los
resultados se observan en la siguiente tabla de contingencia:
Sexo
Masculino
Femenino
Total
No
30
40
50
Total
70
50
120
PRUEBA DE HOMOGENEIDAD
donde
Ejemplo de Aplicacin
Un estudio sobre caries dental en nios de seis ciudades con diferentes
cantidades de fluor en el suministro de agua, ha proporcionado los resultados
siguientes:
Comunidad
A
B
C
D
E
F
N nios
N nios
sin caries
38
8
30
44
64
32
216
con caries
87
117
95
81
61
93
534
125
125
125
125
125
125
750
ANLISIS DE LA VARIANZA
realizar los
Por ello el nivel de significacin obtenido para este contraste sobre la igualdad
de medias de tres muestras no es
sino. (1 (1 )3) Por ejemplo, si se toma un nivel de significacin = 0,1 para cada
uno de los contrastes de igualdad de dos medias, se obtendra que el nivel de
significacin (error de tipo I) para el contraste de las tres medias es de 1 - 0,9 3 = 0,27,
lo que es una cantidad muy alta para lo que se acostumbra usar.
10
Considrese una variable sobre la que acta un factor que puede presentarse
bajo un determinado nmero de niveles, t. Por ejemplo se puede considerar un
frmaco que se administra a t = 3 grupos de personas y se les realiza cierta medicin
del efecto causado:
Resultado de la medicin
Gripe (nivel 1)
Apendicitis
(nivel 2)
n1 = 6
10
10
n2 = 8
Sanos (nivel 3) 2
3
2
1
2
3
2
n3 = 6
En este caso los factores que influyen en las observaciones son tres: el que la
persona padezca la gripe, apendicitis, o que est sana.
De modo general se pueden representar las t muestras (o niveles) del siguiente
modo:
Niveles
Observaciones de X
11
tamaos
muestrales
Nivel
x11
x12
x21
x22
x1n1
n1
Nivel
...
x2n2
n2
...
...
Nivel
xt1
xt2
xtnt
nt
Donde por supuesto, los tamaos de cada muestra ni, no tienen por que ser
iguales. En este caso se dice que se trata del modelo no equilibrado.
Observacin
De ahora en adelante se asume que las siguientes condiciones son verificadas
por las t muestras:
-
12
De este modo
errores eij son variables aleatorias independientes, con valor esperado nulo, y con el
mismo grado de dispersin para todas las observaciones.
Otro modo de escribir lo mismo consiste en introducir una cantidad que sea el
valor esperado para una persona cualquiera de la poblacin (sin tener en cuenta los
diferentes niveles), y considerar los efectos i introducidos por los niveles, de modo
que
13
o bien
Observacin
Se utiliza el nombre de anlisis de la varianza ya que el elemento bsico del
anlisis estadstico ser precisamente el estudio de la variabilidad. Tericamente es
posible dividir la variabilidad de la variable que se estudia en dos partes:
La originada por el factor en cuestin;
La producida por los restantes factores que entran en juego, conocidos o no,
controlables o no, que se conocen con el nombre de error experimental.
Si mediante los contrastes estadsticos adecuados la variacin producida por
cierto factor es significativamente mayor que la producida por el error experimental
se puede aceptar la hiptesis de que los distintos niveles del factor actan de forma
distinta.
Ejemplo: Considrese dos muestras tomadas en diferentes niveles de una
variable, de forma que ambas tengan la misma varianza muestral (lo que indica que
14
15
Donde:
16
Observacin
En el clculo del estadstico SCT intervienen N cantidades, ligadas por una
relacin:
17
18
Considrese el contraste
donde
es un
).
19
Niveles
Observaciones de X
Clculos al margen
Nivel 1
x11
x12
x1n1
n1
Nivel 2
x21
x22
x2n2
n2
...
...
Nivel t
xt1
...
xt2
xtnt
...
nt
N
Se calcula
20
21
Observaciones
Tratamiento 1
-1 1
Tratamiento 2
1/5
-2 -4 -5 -4 -7 5
-22
484/5
110
Tratamiento 3
-1 -2 -4 -1 5
-8
64/5
22
Tratamiento 4
22
484/5
126
ni
-1 5
5
N=20
Fuente de
variacin
Entre
A=265
grados
de
Suma cuadrados
Cuasivarianzas
Estadstico
libertad
t-1=3
tratamientos
Dentro de los N-t=16
tratamientos
= B-C
=204,15
Fexp
=68,167
= A-B
=58,4
=18,676
Fteo
=3,65
= Ft-1,N-t
=3,24
22
23
24
Si se supone que no hay interaccin entre ambos factores, es decir, cada factor
acta independientemente del otro, se tiene el modelo de efectos aditivos:
todos los niveles i1 e i2 y todos los individuos jdentro de esos niveles, estando
equidistribuidos y con la misma varianza segn una ley Gaussiana:
25
Los datos han de ser normales en cada una de las muestras. Esto es algo que
debera ser contrastado previamente antes de utilizar el ANOVA de un
factor mediante, por ejemplo, el test de ajuste a la distribucin normal
mediante el estadstico 2 que ya conocemos, o bien el test de d'Agostino.
26
27
28
Software de Anlisis
29
31
BIBLIOGRAFA
BioMates (2003) Procesamiento de Estadstico de Datos Mdicos. [Documento en
Lnea] disponible en: http://es.geocities.com/riotorto/nopa/nopa.htm, [Consulta:
2004, abril 22]
Chao, Lincoln (1999) Estadstica para las Ciencias Administrativas. Mxico. Mc
Graw-Hill, Tercera Edicin
Garca, A. Navarro, H. y R. Vlez (1995) Estadstica II. Madrid UNED
Siegel Sidnay y John Castellan N. Estadstica No Paramtrica; Aplicada a las
ciencias de la conducta. Mxico. Editorial Trillas
Universidad de Mlaga (s/f) Bioestadstica; Mtodos y Aplicaciones. Malaga
Espaa. Facultad de Medicina. Universidad de Mlaga. [Documento en lnea]
Disponible en: http://ftp.medprev.uma.es/libro/html.htm, [Consulta: 2004, abril
22]
Hernndez Mendo, Antonio y Ral Ramos Polln (2001) Qu es la informtica
aplicada a las ciencias del deporte? [Documento en lnea] disponible en:
http://www.efdeportes.com/efd33a/informa2.htm, Revista Digital - Buenos
Aires - Ao 6 - N 33 - Marzo de 2001, [Consulta: 2004, abril 23]
Realizado por: Lic. Jos Prez Leal
Profesor de Estadstica Aplicada a la Educacin y de Probabilidad y Estadstica
Inferencia UPEL Maracay Venezuela
JosePerezLeal@hotmail.com
32