You are on page 1of 3

DE PARAMETROS ESTIMAC AO EM UM DESENHO COM RESPOSTA BINARIA VIA ALGORITMO EM

NATALY JIMENEZ MONROY UNIVERSIDADE FEDERAL DE PERNAMBUCO

o Introduc a Os estudos longitudinais referem-se a situa c oes desenhadas para detectar mudan cas de uma caracter stica medida a cada individuo em diferentes tempos. Laird & Ware em 1982 descreveram uma classe geral de modelos para tais situa c oes que incluem como caso especial os desenhos de medidas repetidas [1]. Entre as principais diculdades na an alise de dados que vem deste tipo de desenhos, t em-se: complica c ao na modelagem devido ` a depend encia entre as observa c oes repetidas feitas sobre a mesma unidade experimental e a diculdade do pesquisador para controlar as circunst ancias de obten c ao das medi c oes, assim, os dados podem resultar desbalanceados ou parcialmente incompletos. Freq uentemente tem-se desenhos que incluem medidas repetidas de vari aveis com resposta categ orica, nestes experimentos geralmente e de interesse modelar o padr ao de resposta atrav es do tempo. Um caso particular e o desenho de medidas repetidas categ oricas com resposta de tipo bin ario, [4] apresentaram o uso do m etodo de m nimos quadrados ponderados como estrat egia de modelagem em termos de modelos de crecimento como os propostos por Phottho & Roy no ano 1964 para viari aveis de resposta cont nua. Atualmente, os softwares estat sticos como SAS dispoem de procedimentos que permitem a modelagem de dados categ oricos em desenhos de medidas repetidas empregando m etodos de estima ca o de m nimos quadrados ponderados (os quais requerem tamanhos amostrais grandes) e m etodos de m axima verossimilhan ca. No caso de observa c oes faltantes, os m etodos empregados s ao os algoritmos de Newton-Raphson y Ajuste Proporcional, assim como aproxima c oes de Equa c oes Generalizadas de Estima ca o (GEE); em SAS estes
Key words and phrases. Desenhos de medidas repetidas, algoritmo EM, informa c ao incompleta, modelos lineares generalizados.
1

Estima ca o de Par ametros em um Desenho com Resposta Binaria via Algoritmo EM

m etodos trabalham apenas com respostas de tipo bin ario y unicamente com respostas completas, isto e, no caso de encontrar observa co es incompletas estas s ao excluidas da an alise, isto pode levar a uma diminu ca o consider avel do tamanho amostral y da eci encia dos estimadores, esta t ecnica e conhecida como an alise de casos completos. Assim, e importante estudar outros m etodos de estima ca o de par ametros que permitam trabalhar com resposta bin aria incompleta para aproveitar toda a informa c ao dispon vel na pesquisa. Neste trabalho pretende-se apresentar o uso do Algoritmo Esperan caMaximiza c ao (EM) na estima c ao de par ametros em desenhos de medidas repetidas com resposta bin aria incompleta a trav es da compara ca o, em un exemplo particular, com a estima ca o obtida sem incluir as observa co es incompletas (empregando os m etodos padr ao de SAS). A variante espec ca do algoritmo EM aqu trabalhado e o Algoritmo EM pelo M etodo das Pondera c oes proposto inicialmente por [2] para estima c ao em modelos lineares generalizados com covari aveis discretas parcialmente incompletas e posteriormente trabalhado por [3] para o caso de estudos de medidas repetidas com resposta bin aria incompleta. O principal objetivo e aproveitar toda a informa c ao dos dados, substituindo cada uma das observa co es incompletas por um conjunto de observa co es ponderadas. Ibrahim (1990) indica que, sob a suposi c ao de que o mecanismo que origina os dados faltantes e aleat orio (MAR), o passo E do algoritmo EM para qualquer modelo linear generalizado pode expressar-se como uma log-verossimilhan ca ponderada dos dados completos quando as covari aveis n ao observadas s ao supostas pertencentes a uma distribui ca o discreta com rango nito. Esta aproxima c ao permite uma maximiza c ao simples no passo M do algoritmo, levando a estimadores m aximo verossimiles dos par ametros. Para vericar se o uso do algoritmo EM realmente tem vantagens na estima c ao de par ametros com respeito ` a an alise de casos completos, emprega-se um exemplo particular e estimativas obtidas s ao comparadas em termos de: (1) Vari ancia Total: Denida como o tra co da matriz de covari ancia estimada (V T = tr()). (2) Vari ancia Generalizada: Denida como o determinante da matriz de covari ancia estimada (V G = ||). 2

Estima ca o de Par ametros em um Desenho com Resposta Binaria via Algoritmo EM

Para levar a cabo a compara c ao, elimina-se aletatoriamente uma percentagem (10%, 20% e 30%) de observa c oes e e feita a an alise respectiva. Este procedimento foi feito um total de dez vezes para cada percentagem com o objetivo de determinar de uma forma emp rica qual metodologia e mais apropriada para a an alise dos dados. Encontrou- se que em todas as situa c oes as vari ancias foram menores para os resultados do algoritmo EM em compara c ao com a an alise de casos completos, isto sugere que o algoritmo EM poderia ser mais eciente. Tamb em observou-se que as vari ancias aumentam com a propor ca o de informa c ao faltante embora este crecimento seja mais lento para o algoritmo EM do que para a an alise de casos completos. ncias Refere
[1] Hocking, R. (1996) Methods and Applications of Linear Models, John Wiley and Sons. [2] Ibrahim, J. (1990) Incomplete Data in Generalized Linear Models, Journal of American Statistical Association, 85(411):765-769. [3] Lipsitz, S., Ibrahim, J. & Fitzmaurice, G. (1999) Likelihood Methods for Incomplete Longitudinal Binary Responses with Incomplete Categorical Covariates, Biometrics, 55:214-223. [4] Stanek, E. & Diehl, S. (1988) Growth Curve Models of Repeated Binary Response, Biometrics, 44: 973-983.

E-mail address : nataly@cox.de.ufpe.br

You might also like