Professional Documents
Culture Documents
( )
()
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 3
Esta ecuacin es vlida tambin para una poblacin finita en la que se hace
muestreo con reposicin. Para poblaciones finitas en que se haga muestreo
sin reposicin, las ecuaciones (1) quedan sustituidas por las ecuaciones:
Con .
Para el uso de proporciones se utiliza en los: Estudios para determinar
parmetros
Con estos estudios pretendemos hacer inferencias a valores poblacionales
(proporciones, medias) a partir de una muestra.
Estimar una proporcin:
Si deseamos estimar una proporcin, debemos saber:
a) El nivel de confianza o seguridad (1-). El nivel de confianza prefijado da
lugar a un coeficiente (Z).
Para una seguridad del 95% = 1.96, para una seguridad del 99% = 2.58.
b) La precisin que deseamos para nuestro estudio.
c) Una idea del valor aproximado del parmetro que queremos medir (en
este caso una proporcin). Esta idea se puede obtener revisando la
literatura, por estudio pilotos previos. En caso de no tener dicha
informacin utilizaremos el valor p = 0.5 (50%).
Ejemplo:
A cuntas personas tendramos que estudiar para conocer la prevalencia
de diabetes?
Seguridad = 95%; Precisin = 3%: Proporcin esperada = asumamos que
puede ser prxima al 5%; si no tuvisemos ninguna idea de dicha
proporcin utilizaramos el valor p = 0,5 (50%) que maximiza el tamao
muestral:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 4
Donde:
vara, as:
Si la seguridad Z fuese del 90% el coeficiente sera 1.645
Si la seguridad Z fuese del 95% el coeficiente sera 1.96
Si la seguridad Z fuese del 97.5% el coeficiente sera 2.24
Si la seguridad Z fuese del 99% el coeficiente sera 2.576
II. RAZONES:
Una razn es la comparacin por cociente entre dos cifras de diferente o
similar naturaleza.
Por ejemplo si hay un hospital con camas y tiene 95 enfermeras, la razn
sera:
Razn de camas por enfermera = cada enfermera
atiende 4 camas
La manera correcta de expresar el resultado del clculo de una razn es
sealar el nmero de elementos del numerador que existen por cada
elemento del denominador.
Otro ejemplo si en una poblacin de 2.500 habitantes hay 645 viviendas,
cuantos habitantes hay por vivienda, lo dice la razn razn de habitantes
por vivienda hay 4 habitantes por vivienda.
III. TASAS
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 6
En lugar de usar los datos brutos, se puede optar por usar las tasas con
objeto de hacer comparaciones entre los grupos (las comparaciones son
mayormente significativas).
Se define tasa como el nmero de casos en un resultado de inters que
ocurre en un periodo. A menudo se emplea los trminos Tasa y
proporciones los cuales no son sinnimos. Ya que una proporcin es un
coeficiente en el cual los individuos representados en el numerador deben
incluirse en el denominador. Las proporciones carecen de unidades.
En cambio una Tasa incorpora unidades de medicin e intrnsecamente
depende una medida de tiempo.
Se pueden clasificar como 2 tipos de tasas:
Las tasas brutas son calculadas para toda la poblacin. Las tasas especficas
se calculan para un subgrupo especfico que est en riesgo de presentar el
evento. Puede haber tasas por edad, sexo, raza, ocupacin y as
sucesivamente. En la prctica, es ms preciso denominarla razn y no tasa.
Una tasa de cambio es una tasa que describe cmo cambia una cantidad con
respecto a otra. Para calcular la tasa de cambio, divide la diferencia en las
coordenadas y entre la diferencia en las coordenadas x. La tasa de cambio
entre (x1, y1) y (x2, y2) es
) (
)
Se procede a dividir en denominador va la diferencia entre las coordenadas
x.
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 7
las tasas de cambio pueden ser positivas, negativas o cero
a. Tasa de cambio: positivo
b. Tasa de cambio: Negativo
c. Tasa de cambio: cero
La tasa ms utilizada hoy en da vendra hacer la tasa de mortalidad. La tasa
de mortalidad es el nmero de muertes ocurridas en cierto periodo, como
un ao civil, divido entre la poblacin total en riesgo durante el periodo. Se
expresa a menudo este tipo de tasas en trminos de muertes por cada 1000
habitantes o muertes por cada 10, 000 habitantes.
Grafico:
El grafico significa en la vida
real es aumento.
Grafico:
El grafico significa en la vida
real es disminucin.
Grafico:
El grafico significa en la vida
real no hay cambio.
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 8
La tasa de mortalidad mas registrada viene hacer la Tasa de mortalidad
Infantil.
Los factores como edad, sexo y raza a menudo tienen un efecto significativo
en las tasas de la esperanza de vida.
Ahora en lo anterior hemos hablado de tasas brutas ahora se hablara de
tasas especificas. En las tasas que se calcula dentro de subgrupos
relativamente pequeos y bien definidos se denominan Tasas Especificas.
1. TASAS DE ESTANDARIZACION
MTODO DIRECTO DE ESTANDARIZACIN
Como su propio nombre indica permite comparaciones directas entre
poblaciones, este mtodo se centra en el clculo de total de tasas que
resultaran si, en lugar de tener diferentes distribuciones, todas las poblaciones
que se comparan tuvieran la misma composicin estndar.
Para su clculo es necesario disponer de las defunciones y poblaciones por
grupos de edad de las poblaciones a comparar y de la poblacin estndar por
grupos de edad.
La tasa estndar, por este mtodo directo, se obtiene sumando las defunciones
esperadas de cada grupo de edad, que son aquellas que ocurriran si las
defunciones de la poblacin de inters se produjeran en la poblacin estndar.
La poblacin estndar utilizada es la europea de la que se dispone por grupo de
edad; as mismo debemos disponer de las defunciones y poblaciones a
comparar tambin por grupos de edad.
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 9
Ejemplo:
A travs de estos datos podemos calcular las tasas especficas por edad de la
mortalidad de mujeres y hombres en Espaa. Para la estandarizacin
calculamos primero las defunciones esperadas en cada grupo de edad
relacionando las defunciones de cada grupo de edad de la poblacin a
comparar, en vez de con su poblacin, con la poblacin estndar a travs de
una sencilla regla de tres. La sumatoria de las defunciones esperadas en cada
grupo de edad nos proporciona la tasa estndar.
En el ejemplo de la tabla, observamos que las tasas generales o crudas de
mujeres es de 8,1 por 1000 mujeres y de 9,4 por 1000 hombres; mientras que
las tasa estndar de mujeres es de 504,9 por 100000 habitantes de la poblacin
estndar (o 5,1 por 1000) y de 754,6 por 100.000 habitantes de la misma
poblacin estndar (o 7,6 por 1000). Tras la estandarizacin o ajuste de las
tasas la mayor mortalidad de los hombres, respecto a las mujeres, es an mayor
que si hacemos la comparacin con las tasas crudas.
Su principal limitacin
Su principal limitacin es que cuando estudiamos reas geogrficas muy
pequeas pueden existir problemas de precisin.
METODO INDIRECTO
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 10
Implica el uso de un conjunto de todas las tasas especficas por edades de
daos junto con la composicin de edades de cada sub poblacin comparada.
Cuando los nmeros especficos por estrato son pequeos, como suele ocurrir
en poblaciones como una nica planta industrial o una ciudad pequea. No
permite hacer comparaciones directas, pero su clculo es ms preciso y est
indicado en reas con escaso nmero de poblacin.
Su clculo implica obtener los casos esperados, en cada una de las poblaciones
a comparar, si las tasas especficas de la poblacin estndar prevalecieran en
ellas. Los casos o defunciones esperadas se obtienen de forma inversa al
anterior mtodo; esto es, calculamos los casos esperados en la poblacin
estndar si tuviera la estructura por edad de la poblacin a comparar o de
inters.
Estas tasas son promediadas usando como pesos los tamaos de los estratos de
la poblacin de estudio. As, el procedimiento es la imagen en espejo de la
estandarizacin directa. En la estandarizacin directa, la poblacin de estudio
provee las tasas y la poblacin estndar provee los pesos. En la estandarizacin
indirecta, la poblacin estndar provee las tasas y la poblacin de estudio
provee los pesos.
Sin embargo, la comparacin de las tasas indirectamente estandarizadas puede ser
problemtico, porque la tasa estandarizada de cada poblacin de estudio se basa
en su propio conjunto de pesos. De hecho, la nica comparacin que est siempre
permitida es la comparacin entre la poblacin de estudio y la poblacin estndar
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 11
dado que estas tasas indirectas se basan ambas en los pesos de la poblacin de
estudio.
LLEVANDO A CABO LA ESTANDARIZACIN INDIRECTA
Se puede concebir la estandarizacin indirecta como el tomar el nmero de
muertes o eventos en la poblacin de estudio y compararlos con un nmero
esperado de muertes, el nmero de muertes que se esperaran en la poblacin de
estudio si su experiencia de mortalidad (sus tasas especficas por estrato) fueran
las mismas que para la poblacin estndar. La razn de muertes observadas a
esperadas se denomina Razn de Mortalidad Estandarizada (o Razn de
Morbilidad Estandarizada si el resultado a medir es enfermedad y no muerte),
abreviada como RME, y ella, ms que las tasas estandarizadas, es el producto
habitual del proceso de estandarizacin indirecta.
Donde
n e
e
El nmero de muertes observadas tambin puede ser expresada como la
suma de las tasas de mortalidad especficas por estrato multiplicadas por el
tamao de cada estrato:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 12
Donde
O dicho de otra manera, aproximadamente, 300 casos notificados por 100.000
habitantes durante 1989.
Recomendaciones
El numerador de una tasa de incidencia debe reflejar los casos nuevos de
enfermedad que ocurrieron o fueron diagnosticados durante el perodo especfico.
El numerador no debe incluir casos que ocurrieron o se diagnosticaron antes.
Ntese que el denominador es la poblacin en riesgo. Es decir, las personas
incluidas en el denominador deben estar en condiciones de sufrir la enfermedad
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 16
que se est describiendo durante el perodo estudiado. Infortunadamente, a menos
que realicemos un estudio especial, generalmente no podemos identificar y
eliminar las personas no susceptibles a la enfermedad a partir de los datos de
poblacin disponibles. Si la poblacin en estudio es pequea y muy especfica,
como la de un hogar de ancianos, podemos y debemos usar los datos precisos en el
denominador.
El denominador debe representar la poblacin de la cual provienen los casos del
numerador.
Dependiendo de las circunstancias, el denominador ms apropiado ser uno de los
siguientes:
* El promedio de poblacin durante el perodo
* La poblacin (total o en riesgo) a mitad de perodo
* La poblacin a comienzo, del perodo.
Para 10", se puede usar cualquier valor de n. Para la mayora de enfermedades
notificadles, un valor de 100.000 o 105 se usa para 10n.
Las tasas implican cambio en el tiempo. Para las tasas de incidencia de
enfermedad, el cambio va desde el estado de salud al de enfermedad. El perodo de
tiempo debe especificarse. Para los propsitos de vigilancia, el perodo de tiempo
comnmente usado es el ao calendario, pero se puede usar cualquier intervalo
Cuando el denominador es la poblacin al inicio del perodo, la medida es algunas
veces denominada incidencia acumulada. Esta medida es una proporcin ya que
todas las personas a del numerador tambin estn en el denominador. Es una
medida de la probabilidad o riesgo de enfermar; es decir qu proporcin de la
poblacin desarrollar la enfermedad durante el perodo especificado de tiempo.
En cambio, la tasa de incidencia es semejante a la velocidad e indica qu tan
rpidamente se enferma la poblacin en un ao.
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 17
Ejemplo:
La figura 1 representa 10 episodios de una enfermedad en una poblacin de 20
individuos durante un perodo de 16 meses.
Cada lnea horizontal representa el tiempo que una persona dur enferma;
comienza en la fecha de inicio y termina en la fecha de muerte o de recuperacin.
Ahora en el ejemplo, calculamos la tasa de incidencia desde el 1 de octubre de
1990 al 30 de septiembre de 1991, usando la poblacin en el punto medio como
denominador.
Ntese que la poblacin de estudio son 20 individuos. Usaremos 10n= 100.
Para el denominador, usamos la poblacin total a mitad de perodo (poblacin
total menos aqullos que han muerto antes del 1 de abril de 1991).
X = casos nuevos entre el 1 de octubre de 1990 y el 30 de septiembre de 1991 = 4
Y=poblacin total en el punto medio=20-2=18
Por tanto, hubo
una incidencia
anual de 22 casos
por 100 habitantes.
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 18
Tasa de ataque
La tasa de Ataque viene hacer una variante de la tasa de incidencia, que esta
aplicada a una poblacin definida estrictamente y siendo observada por un
perodo limitado de tiempo.
Ejemplo, durante una epidemia. Por regla general, se expresa como un
porcentaje, es decir, 10n es igual a 100.
Ejemplo:
De 75 personas que asistieron a un asado de caridad, 46 desarrollaron'
posteriormente gastroenteritis. Para calcular la tasa de ataque de gastroenteritis,
primero definimos el numerador y el denominador:
X = casos de gastroenteritis ocurridos entre las personas que asistieron al asado
dentro del periodo de incubacin de la enfermedad=46
Y = nmero de personas que asistieron=75
Luego, la tasa de ataque para gastroenteritis es:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 19
La tasa de ataque es una proporcin. Esta proporcin es una medida de la
probabilidad o riesgo de enfermarse. Se podra decir que, entre las personas que
asistieron al asado, la probabilidad o el riesgo de sufrir gastroenteritis fue del 61
%.
Tasa tiempo-persona
Es un tipo de tasa de incidencia que incorpora directamente el tiempo en el
denominador.
Cada persona es observada desde un punto de inicio hasta un punto establecido de
final (inicio de la enfermedad, muerte, migracin fuera del estudio).
El numerador es el nmero de casos nuevos, pero el denominador es algo
diferente. ste es la suma del tiempo que cada persona es observada, totalizado
para todas las personas.
Por ejemplo
Una persona que participa en un estudio que desarrolla la enfermedad de inters 5
aos ms tarde, contribuye con cinco personas-ao al denominador. Una persona
libre de enfermedad y que se pierde para el seguimiento al final del primer ao,
contribuye una persona-ao al denominador. Las tasas tiempo-persona se usan en
estudios de cohortes de enfermedades con Iargos periodos de incubacin o
latencia, tales como algunas enfermedades ocupacionales, sida y las enfermedades
crnicas.
A.2 PREVALENCIA
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 20
Es la proporcin de personas de una poblacin que tienen una enfermedad o
atributo particular en un momento dado o durante un perodo de tiempo.
La frmula para la prevalencia de una enfermedad es la siguiente:
Y la frmula para la prevalencia de atributo es:
EI valor de 10n es generalmente de 1 o 100 para atributos comunes. El valor de
10n puede ser de 1.000, 100.000 o 1 '000.000 para rasgos raros y muchas
enfermedades.
A.3 DIFERENCIA ENTRE PREVALENCIA E INCIDENCIA:
Casi siempre, se confunde la prevalencia y la incidencia. Son parecidos pero se
diferencian en el tipo de casos incluidos en el numerador.
Numerador de la incidencia=casos nuevos en el perodo estudiado
Numerador de la prevalencia=todos los casos presentes en el perodo estudiado
Como se ve:
El numerador de la tasa de incidencia consiste nicamente en las personas que
enfermaron durante el intervalo especfico.
El numerador de la tasa prevalencia incluye todas las personas enfermas en ese
intervalo sin tener en cuenta cuando comenz la enfermedad. Incluye no slo los
casos nuevos sino tambin los casos viejos que permanecieron enfermos algn
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 21
tiempo durante el perodo especfico. Al calcular la prevalencia, un caso cuenta
hasta que se produce su recuperacin o su muerte.
Ejemplo:
En una investigacin de enfermedades de transmisin sexual en San Francisco, 180
de: los 300 pacientes entrevistados manifestaron haber utilizado preservativo, por
lo menos, una vez durante los dos meses anteriores a la entrevista. La prevalencia
de perodo para uso de condn en esta poblacin durante los ltimos dos meses se
calcula as:
1. Identifique X y Y:
X = usuarios de condn = 180
Y=total entrevistados=300
2.'Calcule (x/y) x 10n: 180/300 X 100=60%
La prevalencia del uso del preservativo en los dos meses anteriores al estudio fue
del 60% en esta poblacin de pacientes.
A.4 RAZN DE TASAS:
La razn de tasas se caracteriza porque compara dos grupos en trminos de tasas
de incidencia, tiempo-persona y mortalidad. A semejanza de la razn de riesgo, los
dos grupos son tpicamente diferentes por factores demogrficos o por exposicin
a un agente causal sospechoso. La tasa para el grupo de inters primario se divide
por la tasa para el grupo de comparacin.
La interpretacin del valor de la razn de tasas es similar a la de la razn de riesgo.
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 22
IV. EL ESTADSTICO JI-CUADRADO COMO MEDIDA DE ASOCIACIN
Como primer paso en el clculo de una medida del grado de asociacin entre las
dos variables, se debe construir una tabla de frecuencias esperadas, en contraste
con la tabla de contingencia, que tambin toma el nombre de tabla de valores
observados. La tabla de valores esperados se construye de la siguiente forma; la
frecuencia esperada de la casilla correspondiente a la fila i y a la columna j, ij e est
dada por la frmula
Si
calculamos las frecuencias marginales de la tabla de frecuencias esperadas,
sumando las filas y las columnas, se podr observar que son iguales a las
frecuencias marginales de la tabla de frecuencias observadas.
Si ambas variables son independientes, la tablas de frecuencias esperadas y
observadas sern idnticas. Si difieren, entonces hay asociacin entre la variable
fija y la variable columna. Mientras ms difieren las dos tablas, mayor ser el grado
de asociacin entre las variables.
EJEMPLO 1. Se calcular la tabla de frecuencias esperadas, a partir de la tabla de
frecuencias observadas, sobre el estudio de prevencin de caries.
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 23
Esta tabla se construye multiplicando las frecuencias de la fila y la columna
respectiva, y dividiendo por el total. De esta forma, la frecuencia esperada
correspondiente al tratamiento A y al desarrollo de caries bajo, es igual a
92x82/2000 = 37.72. As se construye toda la tabla, que da los siguientes valores,
redondeados a un decimal:
Si comparamos esta tabla con la de valores observados, del ejemplo 3, vemos que
son muy diferentes.
EJEMPLO 2. Supngase que se aplic la encuesta del ejemplo 1, acerca de armas de
fuego, a una muestra de 1000 personas elegidas al azar y con los datos obtenidos
se construy una tabla de contingencia. Recordar que las variables de inters, y
que se van a cruzar son:
Grado de restriccin esperado con los valores: (a) Mucho ms restringida, (b)
moderadamente ms restringida, (c) tal como est, (d) moderadamente menos
restringida, y (e) mucho menos restringida, nivel educacional con los valores: (a)
hasta 4 Bsico, (b) bsico completo, (c) hasta segundo medio, (d) medio completo,
(e) estudios universitarios incompletos, y (f) titulado universitario. La tabla de
contingencia es la siguiente, con los totales por fila y por columna (frecuencias
Marginales):
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 24
La tabla de frecuencias esperadas se construye multiplicando las frecuencias de la
fila y la columna respectiva, y dividiendo por el total. As la frecuencia esperada
correspondiente a grado de restriccin (a) mucho ms restringida, y nivel
educacional (a) hasta 4 Bsico, es igual a 61x103/1000 = 6.30. De esta forma
cubrimos toda la tabla, que da los siguientes valores, redondeados a un decimal:
A simple vista no es posible determinar si las tablas se parecen, en tal caso las
variables seran independientes, o si difieren, y habra asociacin entre ellas.
ES DECIR:
Entonces lo que falta es una medida que refleje el grado en que difieren estas dos
tablas, que ser una medida del grado de asociacin. Esta medida es la denominada
estadstico ji-cuadrado, en smbolos, 2 , que se define como sigue
en que oij es la frecuencia observada de la casilla i,j, (fila i , columna j), eij es la
frecuencia esperada de la casilla i,j. Las sumas se extienden a travs de todas las
filas y columnas.
Se puede ver que este indicados es cero si ambas tablas son idnticas, es decir, hay
independencia entre las dos variables. En la medida que difieran ambas tablas,
ser ms grande el estadstico ji-cuadrado, lo que ser indicacin de que hay ms
asociacin entre las variables. Hay otra frmula que da el mismo resultado, pero
que es ms fcil de calcular:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 25
Donde N es el total de observaciones.
EJEMPLO 3. Calculamos el estadstico ji-cuadrado para las tablas de frecuencias
observada y esperada del estudio de prevencin de caries, del ejemplo 4. Usaremos
la frmula (2), de modo que 2 = 82/37.7 + 402/25.4 + 342/18.9 + 842/54.3 +
222/36.3 + 122/27.1 200 = 74.46
No es muy claro si este es un valor pequeo o grande.
A. PRUEBAS DE HIPTESIS DE INDEPENDENCIA
Con el estadstico ji-cuadrado se pueden efectuar pruebas de hiptesis para
confirmar si hay asociacin entre las dos variables que se estn cruzando. Esta
prueba se denomina prueba ji cuadrado. Las hiptesis que se van a poner a prueba
son:
H0: Hay independencia entre las variables.
H1: No hay independencia.
Para hacer la prueba, se debe comparar el estadstico con el valor obtenido de la
Tabla Ji cuadrado correspondiente. Para obtener el valor de tabla, se calcula el
parmetro grados de libertad, que es el producto ( nmero de filas 1 ) * ( nmero
de columnas 1)
Este valor se busca en la fila correspondiente de la tabla ji-cuadrado, que se
muestra ms adelante. Si el estadstico ji-cuadrado es mayor que el valor de la
tabla, se rechaza la hiptesis H0, y por lo tanto, se concluye que no hay
independencia entre las dos variables. Si no es mayor, se asume que no hay
evidencia muestral para rechazar esa hiptesis, por lo tanto se asume que si hay
independencia entre las variables. Siempre que se hace una prueba de hiptesis, es
posible rechazar errneamente la hiptesis de inedependencia, siendo que es
verdadera. Se puede cuantificar la probabilidad de cometer este tipo de error. Esta
probabilidad se denomina nivel de significacin de la prueba. No es posible
eliminar la probabilidad de este error, pero se espera que sea pequea.
La tabla siguiente corresponde a un nivel de significacin de 0.5
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 26
(Probabilidad de rechazar errneamente la hiptesis H0). Hay tablas ms
completas, que entregan otras probabilidades de rechazar H0 errneamente, sin
embargo, el valor mayormente aceptado es 0.5.
Una precaucin que se debe tomar con las pruebas ji-cuadrado es que frecuencia
esperada en cada casilla sea de a lo menos 5. En caso contrario, el estadstico ji-
cuadrado se estar distorsionado, y el nivel de significacin no ser el correcto.
B. OTRAS MEDIDAS DE ASOCIACIN:
Como alternativa a efectuar una prueba ji-cuadrado, se puede simplemente
cuantificar el grado de asociacin, utilizando alguna medida de asociacin
adecuada. O puede servir como complemento a la prueba, que slo concluye si hay
o no asociacin, pero no dice cunta asociacin.
Se dispone de tres medidas, todas basadas en el estadstico ji-cuadrado. La primera
medida de asociacin es el coeficiente , definido como
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 27
En que N es el total de observaciones. El coeficiente es mayor que 0, y aunque es
mucho menor que el estadstico ji-cuadrado, no est acotado superiormente. Puede
ser mayor que uno.
Otra medida de asociacin es el coeficiente de contingencia, que se define como
Este coeficiente toma valores entre 0 y 1, sin embargo nunca alcanza el valor 1. Su
mximo depende del nmero de filas y columnas. Por ejemplo, en tablas de 4 filas
por 4 columnas, su valor mximo es de 0.87. Por ltimo, est el coeficiente V de
Cramer.
En que k es el mnimo entre el nmero de filas y el nmero de columnas. Este
coeficiente est acotado entre 0 y 1, y puede alcanzar ambas cotas, por lo tanto es
el mejor de las medidas de asociacin, por ser ms fcil de interpretar. Si hay dos
filas o dos columnas, los coeficientes y V de Cramer son iguales.
EJEMPLO 4. Calcularemos los tres ndices para los datos del estudio de prevencin
de caries en nios, a partir del estadstico ji-cuadrado calculada en el ejemplo 3:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia
Anlisis de Datos Categoricos 28
En este caso hay dos filas, por eso coinciden los coeficientes y V de Cramer.
Recordar que esta ltima toma valores entre 0 y 1, por lo tanto el valor 0.612 se ve
suficientemente grande como para concluir que hay asociacin entre las variables
tratamiento y desarrollo de caries.
BIBLIOGRAFIA:
Fundamentos de la bioestadistica de Morcello Pagano-Kimberlee Gouvreau
Editorial Thomson Learning
Principios y procedmientis segunda edicion de Robert G.D: y James H.
Torrie.
bioestadistica elaborado x Erica Taucher editorial Universitaria primera
edicin.
Estadistica de Murray R. Spiegiel --- segunda edicin, no endurezcas el
corazn