You are on page 1of 28

Universidad Nacional Jorge Basadre Grohmann

Facultad De Ciencias Agrcolas


Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 1

ANALISIS DE DATOS CATEGORICOS

Se trata de establecer si la mayor o menor probabilidad de que un evento
ocurra se debe precisamente a los factores que se sospecha intervienen en
su gnesis y no al azar.

Los anlisis de datos categricos son utilizados para la contrastacin en los
estudios epidemiolgicos es que las relaciones causales postuladas entre las
variables se traducen en trminos probabilsticos.

La construccin de estas medidas se realiza por medio de operaciones
aritmticas simples y de los instrumentos matemticos conocidos como
razones, proporciones y tasas. Antes de abordar las medidas utilizadas en
los estudios epidemiolgicos repasaremos brevemente estos tres
conceptos.

I. PROPORCIONES

Son medidas que expresan la frecuencia con la que ocurre un evento en
relacin con la poblacin total en la cual ste puede ocurrir.
Se calcula dividiendo el nmero de eventos ocurridos entre la poblacin en
la que ocurrieron.

Como cada elemento de la poblacin puede contribuir nicamente con un
evento es lgico que al ser el numerador (el volumen de eventos) una parte
del denominador (poblacin en la que se presentaron los eventos) aquel
nunca pueda ser ms grande que ste. Esta es la razn por la que el
resultado nunca pueda ser mayor que la unidad y oscile siempre entre cero
y uno.

Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 2

Por ejemplo, si en un ao se presentan tres muertes en una poblacin
compuesta por 100 personas, la proporcin anual de muertes en esa
poblacin ser:



A menudo las proporciones se expresan en forma de porcentaje, y en tal
caso los resultados oscilan entre cero y 100. En el ejemplo anterior, la
proporcin anual de muertes en la poblacin sera de 3 por 100, o de 3%.
Ntese, asimismo, que el denominador no incluye el tiempo. Las
proporciones expresan nicamente la relacin que existe entre el nmero
de veces en las que se presenta un evento y el nmero total de ocasiones en
las que se pudo presentar.

1. Proporciones de muestreo de proporciones

Supongamos que una poblacin es infinita y que la probabilidad de
ocurrencia de un suceso (su xito) es p, mientras la probabilidad de que no
ocurra es q=1 p. Por ejemplo, la poblacin puede ser la de todas tus
posibles tiradas de una moneda, en la que la probabilidad del suceso cara
es

. Consideremos todas las posibles muestras de tamao N de tal


poblacin, y para cada una de ellas determinemos la proporcin de xito P.
En el caso de un moneda, P seria la proporcin de caras en N tiradas.
Obtenemos as una distribucin de muestreo de proporciones cuya media

y cuya desviacin tpica

( )

()
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 3

Esta ecuacin es vlida tambin para una poblacin finita en la que se hace
muestreo con reposicin. Para poblaciones finitas en que se haga muestreo
sin reposicin, las ecuaciones (1) quedan sustituidas por las ecuaciones:



Con .
Para el uso de proporciones se utiliza en los: Estudios para determinar
parmetros
Con estos estudios pretendemos hacer inferencias a valores poblacionales
(proporciones, medias) a partir de una muestra.
Estimar una proporcin:
Si deseamos estimar una proporcin, debemos saber:

a) El nivel de confianza o seguridad (1-). El nivel de confianza prefijado da
lugar a un coeficiente (Z).
Para una seguridad del 95% = 1.96, para una seguridad del 99% = 2.58.
b) La precisin que deseamos para nuestro estudio.
c) Una idea del valor aproximado del parmetro que queremos medir (en
este caso una proporcin). Esta idea se puede obtener revisando la
literatura, por estudio pilotos previos. En caso de no tener dicha
informacin utilizaremos el valor p = 0.5 (50%).

Ejemplo:
A cuntas personas tendramos que estudiar para conocer la prevalencia
de diabetes?
Seguridad = 95%; Precisin = 3%: Proporcin esperada = asumamos que
puede ser prxima al 5%; si no tuvisemos ninguna idea de dicha
proporcin utilizaramos el valor p = 0,5 (50%) que maximiza el tamao
muestral:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 4




Donde:

1.962 (ya que la seguridad es del 95%)


p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1 0.05 = 0.95)
d = precisin (en este caso deseamos un 3%)



Si la poblacin es finita, es decir conocemos el total de la poblacin y
desesemos saber cuntos del total tendremos que estudiar la respuesta
seria:



Donde:
N = Total de la poblacin

= 1.962 (si la seguridad es del 95%)


p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1-0.05 = 0.95)
d = precisin (en este caso deseamos un 3%).

A cuntas personas tendra que estudiar de una poblacin de 15.000
habitantes para conocer la prevalencia de diabetes?
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 5


Seguridad = 95%; Precisin = 3%; proporcin esperada = asumamos que
puede ser prxima al 5% ; si no tuviese ninguna idea de dicha proporcin
utilizaramos el valor p = 0.5 (50%) que maximiza el tamao muestral.


Segn diferentes seguridades el coeficiente de

vara, as:
Si la seguridad Z fuese del 90% el coeficiente sera 1.645
Si la seguridad Z fuese del 95% el coeficiente sera 1.96
Si la seguridad Z fuese del 97.5% el coeficiente sera 2.24
Si la seguridad Z fuese del 99% el coeficiente sera 2.576

II. RAZONES:

Una razn es la comparacin por cociente entre dos cifras de diferente o
similar naturaleza.
Por ejemplo si hay un hospital con camas y tiene 95 enfermeras, la razn
sera:
Razn de camas por enfermera = cada enfermera
atiende 4 camas
La manera correcta de expresar el resultado del clculo de una razn es
sealar el nmero de elementos del numerador que existen por cada
elemento del denominador.

Otro ejemplo si en una poblacin de 2.500 habitantes hay 645 viviendas,
cuantos habitantes hay por vivienda, lo dice la razn razn de habitantes
por vivienda hay 4 habitantes por vivienda.


III. TASAS

Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 6

En lugar de usar los datos brutos, se puede optar por usar las tasas con
objeto de hacer comparaciones entre los grupos (las comparaciones son
mayormente significativas).
Se define tasa como el nmero de casos en un resultado de inters que
ocurre en un periodo. A menudo se emplea los trminos Tasa y
proporciones los cuales no son sinnimos. Ya que una proporcin es un
coeficiente en el cual los individuos representados en el numerador deben
incluirse en el denominador. Las proporciones carecen de unidades.
En cambio una Tasa incorpora unidades de medicin e intrnsecamente
depende una medida de tiempo.
Se pueden clasificar como 2 tipos de tasas:
Las tasas brutas son calculadas para toda la poblacin. Las tasas especficas
se calculan para un subgrupo especfico que est en riesgo de presentar el
evento. Puede haber tasas por edad, sexo, raza, ocupacin y as
sucesivamente. En la prctica, es ms preciso denominarla razn y no tasa.
Una tasa de cambio es una tasa que describe cmo cambia una cantidad con
respecto a otra. Para calcular la tasa de cambio, divide la diferencia en las
coordenadas y entre la diferencia en las coordenadas x. La tasa de cambio
entre (x1, y1) y (x2, y2) es

. Las tasas de cambio pueden ser positivas,


negativas o cero.

Este tipo de tasas se describe cuando cambia una cantidad con respecto a la
otra.
Para calcular este tipo de tasas se sigue los siguientes pasos:
Se hace la diferencia entre las coordenadas ((

) (

)
Se procede a dividir en denominador va la diferencia entre las coordenadas
x.
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 7


las tasas de cambio pueden ser positivas, negativas o cero
a. Tasa de cambio: positivo



b. Tasa de cambio: Negativo






c. Tasa de cambio: cero




La tasa ms utilizada hoy en da vendra hacer la tasa de mortalidad. La tasa
de mortalidad es el nmero de muertes ocurridas en cierto periodo, como
un ao civil, divido entre la poblacin total en riesgo durante el periodo. Se
expresa a menudo este tipo de tasas en trminos de muertes por cada 1000
habitantes o muertes por cada 10, 000 habitantes.
Grafico:
El grafico significa en la vida
real es aumento.

Grafico:
El grafico significa en la vida
real es disminucin.

Grafico:
El grafico significa en la vida
real no hay cambio.

Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 8

La tasa de mortalidad mas registrada viene hacer la Tasa de mortalidad
Infantil.
Los factores como edad, sexo y raza a menudo tienen un efecto significativo
en las tasas de la esperanza de vida.
Ahora en lo anterior hemos hablado de tasas brutas ahora se hablara de
tasas especificas. En las tasas que se calcula dentro de subgrupos
relativamente pequeos y bien definidos se denominan Tasas Especificas.

1. TASAS DE ESTANDARIZACION
MTODO DIRECTO DE ESTANDARIZACIN
Como su propio nombre indica permite comparaciones directas entre
poblaciones, este mtodo se centra en el clculo de total de tasas que
resultaran si, en lugar de tener diferentes distribuciones, todas las poblaciones
que se comparan tuvieran la misma composicin estndar.

Para su clculo es necesario disponer de las defunciones y poblaciones por
grupos de edad de las poblaciones a comparar y de la poblacin estndar por
grupos de edad.
La tasa estndar, por este mtodo directo, se obtiene sumando las defunciones
esperadas de cada grupo de edad, que son aquellas que ocurriran si las
defunciones de la poblacin de inters se produjeran en la poblacin estndar.
La poblacin estndar utilizada es la europea de la que se dispone por grupo de
edad; as mismo debemos disponer de las defunciones y poblaciones a
comparar tambin por grupos de edad.

Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 9

Ejemplo:
A travs de estos datos podemos calcular las tasas especficas por edad de la
mortalidad de mujeres y hombres en Espaa. Para la estandarizacin
calculamos primero las defunciones esperadas en cada grupo de edad
relacionando las defunciones de cada grupo de edad de la poblacin a
comparar, en vez de con su poblacin, con la poblacin estndar a travs de
una sencilla regla de tres. La sumatoria de las defunciones esperadas en cada
grupo de edad nos proporciona la tasa estndar.
En el ejemplo de la tabla, observamos que las tasas generales o crudas de
mujeres es de 8,1 por 1000 mujeres y de 9,4 por 1000 hombres; mientras que
las tasa estndar de mujeres es de 504,9 por 100000 habitantes de la poblacin
estndar (o 5,1 por 1000) y de 754,6 por 100.000 habitantes de la misma
poblacin estndar (o 7,6 por 1000). Tras la estandarizacin o ajuste de las
tasas la mayor mortalidad de los hombres, respecto a las mujeres, es an mayor
que si hacemos la comparacin con las tasas crudas.
Su principal limitacin
Su principal limitacin es que cuando estudiamos reas geogrficas muy
pequeas pueden existir problemas de precisin.
METODO INDIRECTO
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 10

Implica el uso de un conjunto de todas las tasas especficas por edades de
daos junto con la composicin de edades de cada sub poblacin comparada.
Cuando los nmeros especficos por estrato son pequeos, como suele ocurrir
en poblaciones como una nica planta industrial o una ciudad pequea. No
permite hacer comparaciones directas, pero su clculo es ms preciso y est
indicado en reas con escaso nmero de poblacin.
Su clculo implica obtener los casos esperados, en cada una de las poblaciones
a comparar, si las tasas especficas de la poblacin estndar prevalecieran en
ellas. Los casos o defunciones esperadas se obtienen de forma inversa al
anterior mtodo; esto es, calculamos los casos esperados en la poblacin
estndar si tuviera la estructura por edad de la poblacin a comparar o de
inters.
Estas tasas son promediadas usando como pesos los tamaos de los estratos de
la poblacin de estudio. As, el procedimiento es la imagen en espejo de la
estandarizacin directa. En la estandarizacin directa, la poblacin de estudio
provee las tasas y la poblacin estndar provee los pesos. En la estandarizacin
indirecta, la poblacin estndar provee las tasas y la poblacin de estudio
provee los pesos.


Sin embargo, la comparacin de las tasas indirectamente estandarizadas puede ser
problemtico, porque la tasa estandarizada de cada poblacin de estudio se basa
en su propio conjunto de pesos. De hecho, la nica comparacin que est siempre
permitida es la comparacin entre la poblacin de estudio y la poblacin estndar
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 11

dado que estas tasas indirectas se basan ambas en los pesos de la poblacin de
estudio.
LLEVANDO A CABO LA ESTANDARIZACIN INDIRECTA
Se puede concebir la estandarizacin indirecta como el tomar el nmero de
muertes o eventos en la poblacin de estudio y compararlos con un nmero
esperado de muertes, el nmero de muertes que se esperaran en la poblacin de
estudio si su experiencia de mortalidad (sus tasas especficas por estrato) fueran
las mismas que para la poblacin estndar. La razn de muertes observadas a
esperadas se denomina Razn de Mortalidad Estandarizada (o Razn de
Morbilidad Estandarizada si el resultado a medir es enfermedad y no muerte),
abreviada como RME, y ella, ms que las tasas estandarizadas, es el producto
habitual del proceso de estandarizacin indirecta.
Donde

= al nmero de muertes en el k-simo estrato de la poblacin de


estudio (muertes observadas)

n e


e
El nmero de muertes observadas tambin puede ser expresada como la
suma de las tasas de mortalidad especficas por estrato multiplicadas por el
tamao de cada estrato:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 12



Donde

= tasa de mortalidad en el k-esimo estrato.


As, la RME puede ser expresada como la razn de dos promedios ponderados de
tasas de mortalidad especficas por estrato donde los pesos son los tamaos
proporcionales de los estratos de la poblacin de estudio:

Donde nt es el tamao total de la poblacin de estudio y wk son los tamaos
proporcionales de los estratos, calculados como nk/n.
La RME (razn de mortalidad estandarizada) indica el exceso o el dficit en la
verdadera experiencia de mortalidad en la poblacin de estudio con respecto a lo
que se hubiera esperado si hubiera tenido la experiencia de la fuerza de mortalidad
en la poblacin estndar (o de referencia).
A. ESTADISTICA DE MORILIDAD

Cuando se habla de enfermedad de una poblacin o el riesgo (probabilidad) de su
presentacin usamos la frecuencia de morbilidad.
A continuacin se ver las medidas de morbilidad, en el siguiente cuadro:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 13

Todas las medidas se pueden convertir a medidas especficas por edad; raza; sexo
o alguna otra caracterstica de cualquier poblacin

En el siguiente cuadro se podr observar como calcular cada una de las medias de
morbilidad:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 14


Describiremos cada una a continuacin
A.1 Tasas de incidencia
Es la forma ms comn de medir y comparar la frecuencia de enfermedad en las
poblaciones. Se usa en lugar de nmeros en bruto para poder comparar la
presencia de enfermedad en diversas poblaciones debido a que las tasas se ajustan
a los diferentes tamaos de poblacin.
La tasa de incidencia expresa la probabilidad o riesgo de enfermar en una
poblacin durante un perodo de tiempo.
Si una poblacin tiene una mayor incidencia de enfermedad que a la otra
poblacin, se dice que la primera tiene un mayor riesgo de desarrollar la
enfermedad que la segunda, siendo iguales otros factores.
Una tasa de incidencia es una medida de la frecuencia con que un evento, como un
caso nuevo de enfermedad, sucede en una poblacin durante un perodo de
tiempo.
La frmula para calcular es la siguiente:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 15

Ejemplo:
En 1989 se informaron 733.151 casos nuevos de gonorrea en la poblacin civil de
los Estados Unidos. A mitad de ese ao, la poblacin civil se estimaba que era de
246'552.000 habitantes. Con estos datos, usamos un valor de n = 5 para 10n.
Calculemos la tasa de incidencia de gonorrea.

1. Definir X y Y : X=casos nuevos de gonorrea en 1989
Y = poblacin civil en 1989
2. Identificar X, Y y 10n: X=733.151
Y=246'522.000
10
5
= 10
5
= 100.000
3. Calcular (x/y) x 10":



O dicho de otra manera, aproximadamente, 300 casos notificados por 100.000
habitantes durante 1989.
Recomendaciones
El numerador de una tasa de incidencia debe reflejar los casos nuevos de
enfermedad que ocurrieron o fueron diagnosticados durante el perodo especfico.
El numerador no debe incluir casos que ocurrieron o se diagnosticaron antes.
Ntese que el denominador es la poblacin en riesgo. Es decir, las personas
incluidas en el denominador deben estar en condiciones de sufrir la enfermedad
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 16

que se est describiendo durante el perodo estudiado. Infortunadamente, a menos
que realicemos un estudio especial, generalmente no podemos identificar y
eliminar las personas no susceptibles a la enfermedad a partir de los datos de
poblacin disponibles. Si la poblacin en estudio es pequea y muy especfica,
como la de un hogar de ancianos, podemos y debemos usar los datos precisos en el
denominador.
El denominador debe representar la poblacin de la cual provienen los casos del
numerador.
Dependiendo de las circunstancias, el denominador ms apropiado ser uno de los
siguientes:
* El promedio de poblacin durante el perodo
* La poblacin (total o en riesgo) a mitad de perodo
* La poblacin a comienzo, del perodo.
Para 10", se puede usar cualquier valor de n. Para la mayora de enfermedades
notificadles, un valor de 100.000 o 105 se usa para 10n.
Las tasas implican cambio en el tiempo. Para las tasas de incidencia de
enfermedad, el cambio va desde el estado de salud al de enfermedad. El perodo de
tiempo debe especificarse. Para los propsitos de vigilancia, el perodo de tiempo
comnmente usado es el ao calendario, pero se puede usar cualquier intervalo
Cuando el denominador es la poblacin al inicio del perodo, la medida es algunas
veces denominada incidencia acumulada. Esta medida es una proporcin ya que
todas las personas a del numerador tambin estn en el denominador. Es una
medida de la probabilidad o riesgo de enfermar; es decir qu proporcin de la
poblacin desarrollar la enfermedad durante el perodo especificado de tiempo.
En cambio, la tasa de incidencia es semejante a la velocidad e indica qu tan
rpidamente se enferma la poblacin en un ao.
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 17



Ejemplo:
La figura 1 representa 10 episodios de una enfermedad en una poblacin de 20
individuos durante un perodo de 16 meses.
Cada lnea horizontal representa el tiempo que una persona dur enferma;
comienza en la fecha de inicio y termina en la fecha de muerte o de recuperacin.
Ahora en el ejemplo, calculamos la tasa de incidencia desde el 1 de octubre de
1990 al 30 de septiembre de 1991, usando la poblacin en el punto medio como
denominador.
Ntese que la poblacin de estudio son 20 individuos. Usaremos 10n= 100.
Para el denominador, usamos la poblacin total a mitad de perodo (poblacin
total menos aqullos que han muerto antes del 1 de abril de 1991).
X = casos nuevos entre el 1 de octubre de 1990 y el 30 de septiembre de 1991 = 4
Y=poblacin total en el punto medio=20-2=18


Por tanto, hubo
una incidencia
anual de 22 casos
por 100 habitantes.


Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 18






Tasa de ataque

La tasa de Ataque viene hacer una variante de la tasa de incidencia, que esta
aplicada a una poblacin definida estrictamente y siendo observada por un
perodo limitado de tiempo.
Ejemplo, durante una epidemia. Por regla general, se expresa como un
porcentaje, es decir, 10n es igual a 100.






Ejemplo:
De 75 personas que asistieron a un asado de caridad, 46 desarrollaron'
posteriormente gastroenteritis. Para calcular la tasa de ataque de gastroenteritis,
primero definimos el numerador y el denominador:
X = casos de gastroenteritis ocurridos entre las personas que asistieron al asado
dentro del periodo de incubacin de la enfermedad=46
Y = nmero de personas que asistieron=75
Luego, la tasa de ataque para gastroenteritis es:


Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 19

La tasa de ataque es una proporcin. Esta proporcin es una medida de la
probabilidad o riesgo de enfermarse. Se podra decir que, entre las personas que
asistieron al asado, la probabilidad o el riesgo de sufrir gastroenteritis fue del 61
%.


Tasa tiempo-persona
Es un tipo de tasa de incidencia que incorpora directamente el tiempo en el
denominador.
Cada persona es observada desde un punto de inicio hasta un punto establecido de
final (inicio de la enfermedad, muerte, migracin fuera del estudio).
El numerador es el nmero de casos nuevos, pero el denominador es algo
diferente. ste es la suma del tiempo que cada persona es observada, totalizado
para todas las personas.




Por ejemplo
Una persona que participa en un estudio que desarrolla la enfermedad de inters 5
aos ms tarde, contribuye con cinco personas-ao al denominador. Una persona
libre de enfermedad y que se pierde para el seguimiento al final del primer ao,
contribuye una persona-ao al denominador. Las tasas tiempo-persona se usan en
estudios de cohortes de enfermedades con Iargos periodos de incubacin o
latencia, tales como algunas enfermedades ocupacionales, sida y las enfermedades
crnicas.
A.2 PREVALENCIA
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 20

Es la proporcin de personas de una poblacin que tienen una enfermedad o
atributo particular en un momento dado o durante un perodo de tiempo.
La frmula para la prevalencia de una enfermedad es la siguiente:





Y la frmula para la prevalencia de atributo es:





EI valor de 10n es generalmente de 1 o 100 para atributos comunes. El valor de
10n puede ser de 1.000, 100.000 o 1 '000.000 para rasgos raros y muchas
enfermedades.
A.3 DIFERENCIA ENTRE PREVALENCIA E INCIDENCIA:
Casi siempre, se confunde la prevalencia y la incidencia. Son parecidos pero se
diferencian en el tipo de casos incluidos en el numerador.
Numerador de la incidencia=casos nuevos en el perodo estudiado
Numerador de la prevalencia=todos los casos presentes en el perodo estudiado
Como se ve:
El numerador de la tasa de incidencia consiste nicamente en las personas que
enfermaron durante el intervalo especfico.
El numerador de la tasa prevalencia incluye todas las personas enfermas en ese
intervalo sin tener en cuenta cuando comenz la enfermedad. Incluye no slo los
casos nuevos sino tambin los casos viejos que permanecieron enfermos algn
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 21

tiempo durante el perodo especfico. Al calcular la prevalencia, un caso cuenta
hasta que se produce su recuperacin o su muerte.
Ejemplo:
En una investigacin de enfermedades de transmisin sexual en San Francisco, 180
de: los 300 pacientes entrevistados manifestaron haber utilizado preservativo, por
lo menos, una vez durante los dos meses anteriores a la entrevista. La prevalencia
de perodo para uso de condn en esta poblacin durante los ltimos dos meses se
calcula as:

1. Identifique X y Y:
X = usuarios de condn = 180
Y=total entrevistados=300
2.'Calcule (x/y) x 10n: 180/300 X 100=60%
La prevalencia del uso del preservativo en los dos meses anteriores al estudio fue
del 60% en esta poblacin de pacientes.
A.4 RAZN DE TASAS:

La razn de tasas se caracteriza porque compara dos grupos en trminos de tasas
de incidencia, tiempo-persona y mortalidad. A semejanza de la razn de riesgo, los
dos grupos son tpicamente diferentes por factores demogrficos o por exposicin
a un agente causal sospechoso. La tasa para el grupo de inters primario se divide
por la tasa para el grupo de comparacin.





La interpretacin del valor de la razn de tasas es similar a la de la razn de riesgo.
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 22



IV. EL ESTADSTICO JI-CUADRADO COMO MEDIDA DE ASOCIACIN

Como primer paso en el clculo de una medida del grado de asociacin entre las
dos variables, se debe construir una tabla de frecuencias esperadas, en contraste
con la tabla de contingencia, que tambin toma el nombre de tabla de valores
observados. La tabla de valores esperados se construye de la siguiente forma; la
frecuencia esperada de la casilla correspondiente a la fila i y a la columna j, ij e est
dada por la frmula


Si
calculamos las frecuencias marginales de la tabla de frecuencias esperadas,
sumando las filas y las columnas, se podr observar que son iguales a las
frecuencias marginales de la tabla de frecuencias observadas.
Si ambas variables son independientes, la tablas de frecuencias esperadas y
observadas sern idnticas. Si difieren, entonces hay asociacin entre la variable
fija y la variable columna. Mientras ms difieren las dos tablas, mayor ser el grado
de asociacin entre las variables.

EJEMPLO 1. Se calcular la tabla de frecuencias esperadas, a partir de la tabla de
frecuencias observadas, sobre el estudio de prevencin de caries.









Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 23


Esta tabla se construye multiplicando las frecuencias de la fila y la columna
respectiva, y dividiendo por el total. De esta forma, la frecuencia esperada
correspondiente al tratamiento A y al desarrollo de caries bajo, es igual a
92x82/2000 = 37.72. As se construye toda la tabla, que da los siguientes valores,
redondeados a un decimal:




Si comparamos esta tabla con la de valores observados, del ejemplo 3, vemos que
son muy diferentes.
EJEMPLO 2. Supngase que se aplic la encuesta del ejemplo 1, acerca de armas de
fuego, a una muestra de 1000 personas elegidas al azar y con los datos obtenidos
se construy una tabla de contingencia. Recordar que las variables de inters, y
que se van a cruzar son:
Grado de restriccin esperado con los valores: (a) Mucho ms restringida, (b)
moderadamente ms restringida, (c) tal como est, (d) moderadamente menos
restringida, y (e) mucho menos restringida, nivel educacional con los valores: (a)
hasta 4 Bsico, (b) bsico completo, (c) hasta segundo medio, (d) medio completo,
(e) estudios universitarios incompletos, y (f) titulado universitario. La tabla de
contingencia es la siguiente, con los totales por fila y por columna (frecuencias
Marginales):







Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 24

La tabla de frecuencias esperadas se construye multiplicando las frecuencias de la
fila y la columna respectiva, y dividiendo por el total. As la frecuencia esperada
correspondiente a grado de restriccin (a) mucho ms restringida, y nivel
educacional (a) hasta 4 Bsico, es igual a 61x103/1000 = 6.30. De esta forma
cubrimos toda la tabla, que da los siguientes valores, redondeados a un decimal:







A simple vista no es posible determinar si las tablas se parecen, en tal caso las
variables seran independientes, o si difieren, y habra asociacin entre ellas.

ES DECIR:
Entonces lo que falta es una medida que refleje el grado en que difieren estas dos
tablas, que ser una medida del grado de asociacin. Esta medida es la denominada
estadstico ji-cuadrado, en smbolos, 2 , que se define como sigue




en que oij es la frecuencia observada de la casilla i,j, (fila i , columna j), eij es la
frecuencia esperada de la casilla i,j. Las sumas se extienden a travs de todas las
filas y columnas.
Se puede ver que este indicados es cero si ambas tablas son idnticas, es decir, hay
independencia entre las dos variables. En la medida que difieran ambas tablas,
ser ms grande el estadstico ji-cuadrado, lo que ser indicacin de que hay ms
asociacin entre las variables. Hay otra frmula que da el mismo resultado, pero
que es ms fcil de calcular:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 25



Donde N es el total de observaciones.

EJEMPLO 3. Calculamos el estadstico ji-cuadrado para las tablas de frecuencias
observada y esperada del estudio de prevencin de caries, del ejemplo 4. Usaremos
la frmula (2), de modo que 2 = 82/37.7 + 402/25.4 + 342/18.9 + 842/54.3 +
222/36.3 + 122/27.1 200 = 74.46
No es muy claro si este es un valor pequeo o grande.

A. PRUEBAS DE HIPTESIS DE INDEPENDENCIA
Con el estadstico ji-cuadrado se pueden efectuar pruebas de hiptesis para
confirmar si hay asociacin entre las dos variables que se estn cruzando. Esta
prueba se denomina prueba ji cuadrado. Las hiptesis que se van a poner a prueba
son:
H0: Hay independencia entre las variables.
H1: No hay independencia.
Para hacer la prueba, se debe comparar el estadstico con el valor obtenido de la
Tabla Ji cuadrado correspondiente. Para obtener el valor de tabla, se calcula el
parmetro grados de libertad, que es el producto ( nmero de filas 1 ) * ( nmero
de columnas 1)
Este valor se busca en la fila correspondiente de la tabla ji-cuadrado, que se
muestra ms adelante. Si el estadstico ji-cuadrado es mayor que el valor de la
tabla, se rechaza la hiptesis H0, y por lo tanto, se concluye que no hay
independencia entre las dos variables. Si no es mayor, se asume que no hay
evidencia muestral para rechazar esa hiptesis, por lo tanto se asume que si hay
independencia entre las variables. Siempre que se hace una prueba de hiptesis, es
posible rechazar errneamente la hiptesis de inedependencia, siendo que es
verdadera. Se puede cuantificar la probabilidad de cometer este tipo de error. Esta
probabilidad se denomina nivel de significacin de la prueba. No es posible
eliminar la probabilidad de este error, pero se espera que sea pequea.
La tabla siguiente corresponde a un nivel de significacin de 0.5
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 26

(Probabilidad de rechazar errneamente la hiptesis H0). Hay tablas ms
completas, que entregan otras probabilidades de rechazar H0 errneamente, sin
embargo, el valor mayormente aceptado es 0.5.










Una precaucin que se debe tomar con las pruebas ji-cuadrado es que frecuencia
esperada en cada casilla sea de a lo menos 5. En caso contrario, el estadstico ji-
cuadrado se estar distorsionado, y el nivel de significacin no ser el correcto.


B. OTRAS MEDIDAS DE ASOCIACIN:

Como alternativa a efectuar una prueba ji-cuadrado, se puede simplemente
cuantificar el grado de asociacin, utilizando alguna medida de asociacin
adecuada. O puede servir como complemento a la prueba, que slo concluye si hay
o no asociacin, pero no dice cunta asociacin.
Se dispone de tres medidas, todas basadas en el estadstico ji-cuadrado. La primera
medida de asociacin es el coeficiente , definido como






Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 27

En que N es el total de observaciones. El coeficiente es mayor que 0, y aunque es
mucho menor que el estadstico ji-cuadrado, no est acotado superiormente. Puede
ser mayor que uno.
Otra medida de asociacin es el coeficiente de contingencia, que se define como





Este coeficiente toma valores entre 0 y 1, sin embargo nunca alcanza el valor 1. Su
mximo depende del nmero de filas y columnas. Por ejemplo, en tablas de 4 filas
por 4 columnas, su valor mximo es de 0.87. Por ltimo, est el coeficiente V de
Cramer.



En que k es el mnimo entre el nmero de filas y el nmero de columnas. Este
coeficiente est acotado entre 0 y 1, y puede alcanzar ambas cotas, por lo tanto es
el mejor de las medidas de asociacin, por ser ms fcil de interpretar. Si hay dos
filas o dos columnas, los coeficientes y V de Cramer son iguales.

EJEMPLO 4. Calcularemos los tres ndices para los datos del estudio de prevencin
de caries en nios, a partir del estadstico ji-cuadrado calculada en el ejemplo 3:









Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia


Anlisis de Datos Categoricos 28



En este caso hay dos filas, por eso coinciden los coeficientes y V de Cramer.
Recordar que esta ltima toma valores entre 0 y 1, por lo tanto el valor 0.612 se ve
suficientemente grande como para concluir que hay asociacin entre las variables
tratamiento y desarrollo de caries.

BIBLIOGRAFIA:

Fundamentos de la bioestadistica de Morcello Pagano-Kimberlee Gouvreau
Editorial Thomson Learning

Principios y procedmientis segunda edicion de Robert G.D: y James H.
Torrie.

bioestadistica elaborado x Erica Taucher editorial Universitaria primera
edicin.

Estadistica de Murray R. Spiegiel --- segunda edicin, no endurezcas el
corazn

You might also like