You are on page 1of 81

15

INTRODUO

A Oncologia uma disciplina complexa, que auxiliada por outras especialidades, como cirurgia, pediatria, patologia, radiologia, psiquiatria, que faz do sucesso um mrito das aes multidisciplinares. Na Oncologia existem trs objetivos principais no atendimento ao paciente, a primeira de tratar, de curar e devolv-los a sociedade, e a segunda est na remisso longa e satisfatria, buscando deixar o paciente bem consigo durante o maior tempo possvel, e quando a chance de remisso remota, o objetivo passa a ser o de controlar a doena e seus sintomas pelo uso correto de terapias paliativas, e a terceira est na melhora de vida do paciente. O Centro de Endoscopia e Assistncia Fertilidade no que tange a Oncologia diz: Nosso objetivo quanto ao cncer conhec-lo para intervir e, medida que aumentamos nosso conhecimento, preveni-lo. O esforo atingir o processo no visvel do problema que, como um iceberg, muito maior do que parece ser. Certamente j se avanou muito, como pode ser verificado no manifesto da atual abordagem das neoplasias malignas. Como o Hospital Regional do Oeste (HRO) um importante Centro de Tratamento Oncolgico na regio e tambm no Estado, pois oferece tratamentos como Radioterapia, Quimioterapia, Cirurgia Oncolgica entre outros. Tambm busca atingir aos trs objetivos principais da oncologia que esto focados na cura e na melhora da qualidade de vida do paciente. Este trabalho prope a construo de um prottipo que possibilite a definio de um ambiente utilizando-se de um Data Warehouse (Armazm de Dados) para aplicao de tcnicas de Data Mining (Minerao de Dados) e On-Line Analytic Processing (OLAP), tendo como funo conhecer os casos tratados no HRO. No desenvolvimento do prottipo sero utilizados para validao dados dos atendimentos realizados como: nome do paciente, sexo, idade, diagnstico, cidade, cor, religio. Alm destes so utilizados dados clnicos, cirrgicos, exames auxiliares, avaliao nutricional e terapias que sero utilizadas para gerar um Data Mart. O prottipo tem por objetivo propiciar a criao de ambiente Data Warehouse, auxiliando na identificao de padres atravs de tcnicas Data Mining (Minerao de dados) e On-Line Analytic Processing (OLAP), fornecendo subsdio aos profissionais de oncologia no processo de tomada de deciso.

16

O estudo de caso ser realizado no Hospital Regional do Oeste (HRO), com intuito de oferecer uma ferramenta de apoio, para extrao de informaes que possam ser relevantes no tratamento dos pacientes oncolgicos.

1.1 OBJETIVOS Os objetivos esto divididos em gerais e especficos.

1.1.1 Gerais Construir um prottipo que permita a equipe tcnica de oncologia, criar um ambiente Data Warehouse utilizando-se tcnicas de Data Mining e OLAP buscando oferecer subsdio a tomada de deciso.

1.1.2 Especficos

Para atingir o objetivo geral, as seguintes etapas se fazem necessrias: compreender a oncologia; estudar Data Warehouse (Armazm de Dados) e Data Mart; estudar as tcnicas de Data Mining para extrao de informaes; avaliar as etapas para construo de um Sistema de Apoio a Tomada de Deciso; levantar os requisitos necessrios para o desenvolvimento do prottipo; desenvolver o prottipo permitindo a criao de um ambiente Data Warehouse, aplicando de tcnicas de Data Mining e OLAP.

17

1.2 PROBLEMATIZAO De acordo com especialistas, muitos casos de cncer podem ser relacionados a fatores ambientais, como excesso de exposio ao sol (cncer de pele), o consumo do cigarro (cncer de pulmo, boca), e ainda existem estudos para detectar outros fatores ou hbitos que levam a ocorrncia do cncer. Atualmente no Brasil os dados estatsticos com relao ao cncer so muito falhos e insuficientes, no retratando a realidade que vivemos. O Instituto Nacional do Cncer (INCA) tem como atribuio desenvolver uma poltica de preveno, deteco e tratamento do cncer, visando qualificao no tratamento e o acompanhamento eficiente dos casos da doena no Brasil, alm de pesquisas sobre os fatores motivadores da doena. A situao verificada no Brasil tambm faz parte da realidade no estado de Santa Catarina, bem como na Regio Oeste, onde o principal centro de tratamento desta doena no Hospital Regional do Oeste (HRO), disponibilizando profissionais das mais variadas especialidades como: radioterapeutas, oncologistas, cirurgies oncologistas, fsico,

nutricionistas, assistentes sociais, enfermeiros, fisioterapeutas, psiclogos entre outros. Esta estrutura fornece terapias como radioterapia, quimioterapia, cirurgia oncologia,

acompanhamento clinico, nutricional, psicolgico e assistencial, visando ao bem estar do paciente em tratamento e de seus familiares. A falta de registros estatsticos uma realidade que parece no importar a sociedade, mas o crescente aumento no nmero de casos, refletindo no aumento de pessoas que convivem com est neoplasia, torna o tema de alta relevncia, pois se conhecermos os hbitos, costumes dos pacientes tratados, ser possvel modificar hbitos, costumes, permitindo a preveno, a deteco precoce, visando reduzir o ndice de mortalidade. O uso das novas tecnologias de Sistemas de Informao (SI) visam permitir que os dados sejam gerados e avaliados de forma otimizada e eficiente, atravs das novas tcnicas, disponveis como: Data Warehouse (DW), Data Mining (DM), Business Intelligence (BI). A proposta deste projeto desenvolver um prottipo que possibilite a criao de um ambiente Data Warehouse, utilizando tcnicas de minerao de dados, grficos, tabelas e relatrios, que permitam aos profissionais a identificao de hbitos, tendncias e histricos familiares que auxiliem no aperfeioamento do tratamento de pacientes.

18

O uso dos SIs permitem que os profissionais identifiquem informaes que antes eram desconhecidas, j que o processo de cruzamento de informaes dos casos tratados era realizado de forma manual, o que dificultava substancialmente a identificao de padres. 1.3 JUSTIFICATIVA O cncer pode surgir de vrias causas, e o seu surgimento pode ser derivado de uma seqncia de eventos.
Cncer (ou neoplasia, ou tumor maligno) uma classe de doenas caracterizadas pelo crescimento descontrolado de clulas aberrantes, e pode matar devido invaso destrutiva de rgos normais por estas clulas, por extenso direta ou por disseminao distncia, que pode ser atravs do sangue, linfa ou superfcie serosa (SASSE, 2002).

As neoplasias a terceira maior causa de morte no Brasil (superadas apenas pelas doenas do aparelho circulatrio e pelas causas externas / violncia). Estima-se que durante o sculo 21 o cncer j seja a principal causa de morte no Brasil (INCA, 2002). De acordo com o Instituto Nacional do Cncer (INCA), que tem como funo assistir ao Ministrio da Sade na formulao de polticas de preveno, diagnstico e tratamento de neoplasias malignas e afeces correlatas. O objetivo planejar, organizar, executar, dirigir, controlar e supervisionar planos, programas, projetos e atividades em mbito nacional, (INCA, 2002). Como estas atividades tambm so desempenhadas no HRO, necessrio que a instituio tambm possa avaliar, planejar, organizar, executar e supervisionar seus servios, tendo como meta a qualidade, eficincia e eficcia no tratamento dos pacientes. Como o sucesso da terapia contra o cncer depende da escolha das modalidades de tratamento que mais se adaptam ao paciente e sua doena, faz-se necessrio a cooperao entre especialidades, tornando o conhecimento de casos j atendidos e seus resultados alcanados um fator de grande importncia. Este projeto visa fornecer uma ferramenta que permita aos profissionais de oncologia, identificar, investigar e avaliar padres que possam dar maior consistncia as decises. As decises podem estar vinculadas a tratamentos, campanhas de preveno e projetos educacionais, visando melhoria da qualidade de vida e reduo de futuros casos.

19

Como as tcnicas de Data Warehouse e Data Mining tm sido muito utilizadas em mbito comercial, possibilitando aos empresrios definir estratgias futuras para sua empresa, porque no utiliz-las tambm para profissionais e gestores de servios de sade? A proposta deste trabalho consiste em fornecer uma ferramenta que permita a definio de um ambiente com os dados considerados relevantes, atravs da extrao, validao, transformao e carga. Aps estas etapas necessrias para obteno de informaes possvel a busca de conhecimentos que transmitam maior confiabilidade no tratamento indicado, bem como possveis formas de evitar eventos que possam levar as ocorrncias destas neoplasias. Atualmente o HRO utiliza-se de fichas e formulrios impressos onde so coletadas informaes sobre hbitos gerais dos pacientes (alimentao, prticas de esporte), informaes pessoais (nome, idade, sexo, cidade), histricos familiares e tratamentos (procedimento, mdico, diagnstico). Portanto, a importncia deste trabalho est em otimizar a coleta de informaes atravs de arquivos textos, ou ainda, inserindo os dados coletados atravs de fichas diretamente na base. Com isso possvel o cruzamento de informaes e a identificao de informaes de forma rpida, no necessitando de um trabalho exaustivo de contagem manual, o que torna o processo demorado, evitando que informaes relevantes sejam desperdiadas.

1.4 PROCEDIMENTOS METODOLGICOS No desenvolvimento do prottipo foi necessria uma pesquisa ampla sobre cncer, oncologia, Data Warehouse, OLAP, Data Mining e suas tcnicas. Tambm foi necessrio obter conhecimento dos procedimentos envolvidos nos servios da oncologia do Hospital Regional do Oeste (HRO), onde foi aplicada a pesquisa e validado o prottipo. O prottipo possui uma abordagem quantitativa considerando que os dados foram avaliados e minerados, mas tambm qualitativa, pois o resultado desta minerao permitir a anlise e a busca por padres que objetivam melhorar a qualidade dos tratamentos oncolgicos prestados pelo HRO. A pesquisa teve como objetivo o desenvolvimento de um prottipo que possibilite aos profissionais que atuam na rea oncolgica, acesso a informaes relacionadas pacientes atendidos, diagnosticados e tratados.

20

Para auxiliar na construo do estudo de caso utilizou-se materiais bibliogrficos como: livros, revistas, monografias, alm de manuais e artigos disponveis na internet e tambm nos Servios de Oncologia do HRO. Conforme exposto a pesquisa foi aplicada, quantitativa e qualitativa, exploratria, bibliogrfica, documental, sendo o estudo de caso realizado no HRO.

1.5 ORGANIZAO DO TRABALHO O trabalho composto por sete captulos, sendo dividido em itens e sub-itens. No captulo dois abordado o tema oncologia, cncer, conceitos, tratamento e informaes sobre o tema. No captulo trs sero abordados assuntos como Business Intelligence, evoluo dos sistemas de apoio deciso, alm de aspectos sobre Data Warehouse (Armazm de Dados), os elementos bsicos, arquitetura, suas etapas de construo, o modelo de dados utilizado, o que so metadados e um estudo sobre data mart. Tambm ser abordado o tema Data Mining, relatando seu funcionamento, etapas e tcnicas. No captulo quatro, o principal objetivo apresentar um estudo do ambiente, que de suma importncia para permitir que seja proposto um modelo. Neste estudo importante conhecer o histrico, a estrutura organizacional, como est definido o fluxo de informaes e levantamento de requisitos. No captulo cinco tem como prioridade demonstrar as ferramentas utilizadas, e a apresentao do prottipo desenvolvido, levando em considerao a reviso bibliogrfica. As especificaes coletadas no levantamento de requisitos foram utilizadas na validao do prottipo. No captulo seis, so enfatizadas as consideraes finais, contribuies e

recomendaes para trabalhos futuros.

21

ONCOLOGIA - ESTUDO DOS TUMORES (CNCER)

Este captulo tem como objetivo compreender o que oncologia, o que o cncer, como se ocorre sua formao, quais os tipos, as modalidades teraputicas, como evitar e como est sendo o registro dos casos no Mundo e no Brasil. 2.1 ONCOLOGIA

A origem da palavra do grego ogkos (tumor) mais logos (tratar de), que tem como significado o estudo dos tumores (Dicionrio). Segundo Sasse (2002), a oncologia tornou-se uma disciplina ampla e muito interessante, sendo auxiliada por vrias especialidades, ou seja, multidisciplinares, pois envolve reas diversas como: cirurgia, pediatria, patologia, radiologia, psiquiatria, nutrio, fisioterapia entre outras. Na oncologia trs objetivos so considerados primordiais, que consistem em curar o paciente o mais breve possvel, no sendo possvel, o segundo objetivo postergar o mximo e o terceiro com a melhor qualidade possvel, permitindo que o paciente tenha uma vida menos sofrida. Tambm levado em considerao a sensibilidade e o bom senso. Como relata Cenafert (2003), o objetivo da oncologia conhecer o cncer, para tratar, e com o domnio do conhecimento, preveni-lo. H uns 40 anos at mesmo para os profissionais mdicos comunicarem ao seu paciente o problema era complicado, normalmente esse contato era feito com familiares, a mudana de cultura e as possibilidades de cura minimizaram este fato, j ficou muito mais fcil discutir com o prprio paciente sobre seu problema e as possibilidades de tratamento.
Antigamente o conhecimento da doena partia do diagnstico, constatado em fases avanadas. Nesta poca pouco se podia fazer para o conhecimento das alteraes morfolgicas nas clulas, pelo microscpio, quando a doena incipiente. O avano seguiu ainda mais e estamos no estgio onde, em alguns casos, dispomos de tecnologia para detectar alteraes que esto em andamento na molcula e que podem ser desencadeadoras de uma neoplasia no futuro. A ao preventiva, nesse caso pode ser bastante precose (CENAFERT, 2003).

22

Como relata Cenafert (2003) quarenta por cento dos tumores so prevenveis e uma outra quantidade igual controlvel, e os outros vinte por cento esto sendo pesquisados e estudados constantemente. 2.2 DEFINIO DO CNCER

O cncer, ou neoplasias, ou ainda tumor maligno so clulas descaracterizadas que passam por um crescimento descontrolado, podendo levar a morte devido invaso destrutiva de rgos normais, por extenso direta ou por disseminao distncia, que pode ser disseminada pelo sangue, linfa ou superfcie serosa. Este comportamento anormal das clulas cancerosas geralmente espelhado por mutaes genticas, expresses de caractersticas ontolgicas, ou secreo anormal de hormnios ou enzimas (SASSE, 2002). Segundo Inca (2002), o cncer um conjunto de 100 doenas com crescimento desordenado, maligno, que invadem clulas e rgos, disseminando-se por outras partes do corpo, tambm conhecido como metstase. A diviso descontrolada destas clulas ocasiono tumores (acmulo de clulas cancerosas), que so definidas como neoplasias malignas, j os tumores benignos so simplesmente clulas que so muito parecidas com as normais e que se dividem vagarosamente sem fornecer risco vida do paciente.
Todos os cnceres tm o potencial de invaso ou de metastalizao, mas cada tipo especfico tem caractersticas clnicas e biolgicas, que devem ser estudadas para um adequado diagnstico, tratamento e acompanhamento (SASSE, 2002).

A figura abaixo demonstra como atuam as clulas anormais (cancerosas), que infiltram tecidos at atingir rgos.

Figura 1: Ilustrao de como ocorre a formao do tumor (INCA, 2002)

23

2.3 CAUSAS DO CNCER

A seqncia de eventos pode desencadear a ocorrncia, ou auxiliar no surgimento dos tumores, atravs de modificaes genticas que transformem clulas normais em clulas destrutivas, que no seguem os padres das outras clulas (SASSE, 2002).
As causas de cncer so variadas, podendo ser externas ou internas ao organismo, estando ambas inter-

relacionadas. As causas externas relacionam-se ao meio ambiente e aos hbitos ou costumes prprios de um ambiente social e cultural. As causas internas so, na maioria das vezes, geneticamente pr-determinadas, esto ligadas capacidade do organismo de se defender das agresses externas. Esses fatores causais podem interagir de vrias formas, aumentando a probabilidade de transformaes malignas nas clulas normais (INCA, 2002).

Segundo Inca (2002), a maioria dos cnceres, em torno de 80 ou 90%, so ocasionados por fatores ambientais, incentivados por hbitos como: cigarro, que causa principalmente o cncer de pulmo, exposio muito longa ao sol que causa cncer de pele, entre outros, tambm podendo ser ocasionados por vrus que causam, por exemplo, a leucemia (cncer no sangue). Segundo Inca (2002) casos que sejam efetivamente causados por fatores hereditrios, familiares e tnicos, so raros, apesar de existirem alguns casos tipo de portadores de retinoblastoma, que em 10% tem um histrico familiar de tumores, bem como alguns tipos de cncer de mama, estmago e intestino, que possuem um componente familiar bastante significativo. Tambm existem alguns dados com relao a grupos tnicos como orientais que apresentam casos raros de leucemia linfoctica e negros com o Sarcoma de Ewing. 2.4 ESTADIAMENTO GERAL DO CNCER

O Cenafert (2003) apresenta um demonstrativo simplificado de como so divididos os estgios do cncer: Estgio 1. Localizado: Est em geral dentro do rgo de origem, normalmente possvel de cura com cirurgia e irradiao no local afetado;

24

Estgio 2. Localizado mas extenso: Quando sai para fora do rgo origem, fica normalmente prximo, em certo momentos curvel com cirurgia e irradiao, em conjunto com a quimioterapia; Estgio 3. Disseminado regionalmente: Ultrapassa os limites do rgo origem, passando por muitos tecidos, podendo atingir gnglios (linfonodos), pode ser curado, mas em muitos casos no ocorre a cura e o tratamento do local ou do sistema depende do tumor; Estgio 4. Disseminado difusamente: Quanto j atingiu vrios rgos distantes, os casos de cura so muito raros. 2.5 MODALIDADES TERAPUTICAS

Abaixo so demonstradas as modalidades teraputicas utilizadas segundo Sasse (2002). Cirurgia: Utilizada para tumores localizados em situaes anatmicas favorveis. uma modalidade muito importante na cura, mas que no caso de tumores disseminados no suficiente. Radioterapia: Medido em rads, utilizados em tumores que costumam retornar aps cirurgia, podendo ocasionar leses em clulas prximas ao tumor, e a quantidade de aplicao depende do tumor. Quimioterapia: Utilizam medicamentos que causam danos s clulas, utilizando vrios medicamentos considerando-se sensibilidades diferentes s drogas antineoplasicas, em geral leso de DNA celular. A causa da maioria dos efeitos colaterais como: nuseas, vmitos, anemia, mielossupresso so devido toxicidade contra clulas normais. Normalmente utilizada depois de outras terapias como: tratamento cirrgico, radioterpico em caso de cncer de leucemias, linfomas, testculo, etc. Terapia biolgica: Uso de modificadores biolgicos, fazendo com que as clulas tumorais sejam de fcil controle e que permitam ao prprio organismo o combate doena. 2.6 TIPOS DE CNCER

Os tipos de cncer e seus fatores de risco conforme o Infocncer (2004) so:

25

2.6.1. Cncer de Boca Para Infocncer (2004), os fatores que podem levar ao cncer de boca so os vcios de fumar cachimbos e cigarros, o consumo de lcool, a m higiene bucal e o uso de prteses dentrias mal-ajustadas. 2.6.2. Cncer do Colo do tero Os fatores sociais, ambientais e os hbitos de vida, tais como baixas condies scioeconmicas, atividade sexual antes dos 18 anos de idade, pluralidade de parceiros sexuais, vcio de fumar (diretamente relacionado quantidade de cigarros fumados), hbitos de higiene e o uso prolongado de contraceptivos orais so os principais motivos da doena. Estudos recentes mostram ainda que o vrus do papiloma humano (HPV) e o Herpesvrus Tipo II (HSV) tm papel importante no desenvolvimento da displasia das clulas cervicais e na sua transformao em clulas cancerosas. O vrus do papiloma humano (HPV) est presente em 94% dos casos de cncer do colo do tero (INFOCNCER, 2004). 2.6.3. Cncer de Fgado Cerca de 50% dos pacientes com carcinoma hepatocelular apresentam cirrose heptica, que pode estar associada ao etilismo (Consumo de Bebida alcolica) ou hepatite crnica, cujo fator etiolgico predominante a infecco pelo vrus da hepatite B, segundo (INFOCNCER, 2004). 2.6.4. Cncer de Laringe Conforme Infocncer (2004) h uma forte associao entre a ingesto excessiva de lcool e o vcio de fumar, com o desenvolvimento de cncer nas vias aerodigestivas superiores. O tabagismo o maior fator de risco para o desenvolvimento do cncer de laringe. Quando a ingesto excessiva de lcool adicionada ao fumo, o risco aumenta para o cncer supragltico. Pacientes com cncer de laringe que continuam a fumar e beber tem probabilidade de cura reduzida e aumentam o risco de aparecimento de um segundo tumor primrio na rea de cabea e pescoo. 2.6.5. Cncer de Mama Segundo Infocncer (2004), as causas de cncer de mama ainda so desconhecidas. O histrico familiar constitui o fator de risco mais importante, especialmente se o cncer ocorreu na me ou em irm, se foi bilateral e se desenvolveu antes da menopausa. Outro fator de risco a exposio radiao ionizante antes dos 35 anos. A menopausa tardia

26

(alm dos 50 anos, em mdia) est associada a uma maior incidncia, assim como a primeira gravidez aps os 30 anos de idade. No entanto, ainda no est comprovado se a mulher que retarda intencionalmente a gravidez para depois dos 30 anos tem maior risco de que aquelas cuja gravidez no pde ocorrer espontaneamente. Continua sendo alvo de muita controvrsia o uso de contraceptivos orais no que diz respeito sua associao com o cncer de mama. Aparentemente, certos subgrupos de mulheres, com destaque para as que usaram plulas com dosagens elevadas de estrognios ou por longo perodo de tempo, tm maior risco. Outro fator de risco a ingesto regular de lcool, mesmo que em quantidade moderada, que gera um aumento moderado do risco de cncer de mama. 2.6.6. Cncer de Prstata Os antecedentes familiares tm particular importncia, pois elevam o risco em trs vezes ou mais para os descendentes de doentes de cncer de prstata. Quanto aos fatores ambientais, existem muitas relaes possveis, entre as quais com substncias qumicas utilizadas na indstria de fertilizantes, ferro, cromo, cdmio borracha e chumbo, embora no seja comprovada a correlao entre esses fatores e uma maior incidncia do cncer de prstata (INFOCNCER, 2004). Outros fatores importantes para Infocncer (2004) so as dietas ricas em gordura animal que podem aumentar as taxas de andrognios e estrognios e relacionar-se com o aumento dos tumores da prstata, ao contrrio da gordura vegetal e dos frutos do mar. Calcula-se que de 75% a 80% dos tumores no se expressam clinicamente, e apenas 20% a 25% manifestaro sintomas. Destes, 10% so focais, 40% so iniciais e talvez curveis e 50% so avanados. Estes nmeros variam com a maior ou menor possibilidade de deteco precoce da doena. Os tumores encontrados nas necropsias so geralmente pequenos, bem diferenciados e esto confinados glndula, ao contrrio do que ocorre com os homens que morrem de cncer de prstata, que portam tumores grandes ou invasivos. O retardo do diagnstico prende-se a diversos fatores: a falta de informao da populao leiga, que mantm crenas ultrapassadas e negativas sobre o cncer e seu prognstico; a falta de alerta dos profissionais da sade para o diagnstico precoce dos casos; o preconceito contra o cncer e contra o toque retal; a inexistncia de um exame especfico e sensvel que possa detectar tumor em fase microscpica e a falta de rotinas abrangentes programadas nos servios de sade pblicos e privados que favorea a deteco do cncer, inclusive o de prstata.

27

2.6.7. Cncer de Pulmo Independentemente do tipo celular ou subcelular, o tabagismo o principal fator de risco do cncer pulmonar, sendo responsvel por 90% dos casos. Outros fatores relacionados so certos agentes qumicos (como o arsnico, asbestos, berlio, cromo, radnio, nquel, cdmio e cloreto de vinila, principalmente encontrados no ambiente ocupacional), fatores dietticos (baixo consumo de frutas e verduras), a doena pulmonar obstrutiva crnica (enfisema pulmonar e bronquite crnica), fatores genticos (que predispem ao carcinognica de compostos inorgnicos de asbesto e hidrocarbonetos policclicos aromticos) e histria familiar de cncer de pulmo (INFOCNCER, 2004). 2.6.8. Cncer de Ovrio As mulheres que apresentam diagnstico de cncer de mama ou intestino, ou tm parentes prximos com esses tipos de cnceres so propensas a desenvolver o cncer de ovrio. As mulheres que nunca tiveram filhos tambm tm mais chances de desenvolver a doena. Nesse caso, a ovulao incessante, portanto a possibilidade de haver problemas no ovrio maior. J a gravidez e a menopausa produzem o efeito contrrio: reduzem o risco deste tipo de cncer. A amamentao tambm protege a mulher contra o cncer de ovrio. A presena de cistos no ovrio, bastante comum entre as mulheres, no deve ser motivo para pnico. O perigo s existe quando eles so maiores que 10 cm e possuem reas slidas e lquidas. Nesse caso, quando detectado o cisto, a cirurgia o tratamento indicado (INFOCNCER, 2004). 2.6.9. Leucemia A leucemia uma doena maligna dos glbulos brancos (leuccitos) de causa no conhecida. Ela tem como principal caracterstica o acmulo de clulas na medula ssea. A medula o local de formao das clulas sangneas, ocupa a cavidade dos ossos e conhecida popularmente por tutano. Nela so encontradas as clulas mes ou precursoras que originam os elementos figurados do sangue (glbulos brancos, glbulos vermelhos ou hemcias ou eritrcitos e plaquetas). Os principais sintomas de leucemia decorrem do acmulo dessas clulas na medula ssea, prejudicando ou impedindo a produo dos glbulos vermelhos (causando anemia), glbulos brancos (causando infeces) e plaquetas (causando hemorragias e manchas roxas). Depois de instalada, a doena progride rapidamente, exigindo incio de tratamento rpido. (INFOCNCER, 2004).

28

2.6.10. Melanoma ou Cncer de Pele Os fatores de risco levantados por Infocncer (2004), em ordem de importncia a sensibilidade ao sol (queimadura pelo sol e no bronzeamento), a pele clara, a exposio excessiva ao sol, a histria prvia de cncer de pele, histria familiar de melanoma, nevo congnito (pinta escura), maturidade (aps 15 anos de idade a propenso para este tipo de cncer aumenta), xeroderma pigmentoso (doena congnita que se caracteriza pela intolerncia total da pelo ao sol, com queimaduras externas, leses crnicas e tumores mltiplos) e nevo displsico (leses escuras da pele com alteraes celulares prcancerosas). 2.6.11. Tumores de Ewing (Tumor de Askin) Para Infocncer (2004), a causa desconhecida. No parece ser hereditria. So tumores extremamente raros em negros e asiticos. 2.7 CONSIDERAES FINAIS DO CAPTULO Neste captulo foi visto sobre o que oncologia, cncer, as causas, os estgios, seus tratamentos e tipos de cnceres, a seguir comearemos a conhecer as tecnologias a serem utilizadas para o desenvolvimento do projeto.

29

BUSINESS INTELLIGENCE BI

Neste captulo sero abordados assuntos como Business Intelligence, evoluo dos sistemas de apoio deciso, alm de aspectos sobre Data Warehouse (Armazm de Dados), os elementos bsicos, arquitetura, suas etapas de construo, o modelo de dados utilizado, o que so os metadados e um estudo sobre data mart. Tambm ser abordado o tema Data Mining, relatando seu funcionamento, etapas e tcnicas. Inicialmente importante o entendimento dos termos que constituem esse conceito: Business (negcio) e Intelligence (inteligncia), ou seja, inteligncia de negcio. O objetivo do BI est em servir de auxilio para tratamento da base de dados existente, de forma a melhorar o processo de tomada de deciso. O BI engloba o uso de ferramentas sofisticadas, como por exemplo, a Inteligncia Artificial (IA), propiciando informaes mais trabalhadas, gerando uma base de conhecimento, obtida atravs da base de dados existente, sendo disseminado pela empresa em um contnuo processo de verificao e aprimoramento. De acordo com Data Warehouse (1999) apud Smaniotto (2001), BI a unio de conceitos e metodologias, utilizando-se de fatos que forneam suporte a tomada de deciso. Para MV2 (2001) apud Smaniotto (2001), BI ou Inteligncia Empresarial tem como objetivo apresentar informaes de maneira e formato corretos e em tempo hbil para dar suporte tomada de decises. A figura abaixo demonstra uma viso geral da arquitetura de um BI:

Figura 2. Viso Geral da Arquitetura de um Business Intelligence (ALCNTARA, 2003)

30

Conceituando seus componentes: operacional: so os dados do dia-a-dia da empresa. Segundo Inmon (1997), " denominado desta forma, pois, est relacionado com operaes de negcios dirias da corporao". staging area (SA): rea de tratamento, padronizao e transformao da informao. Tambm denominadas por Inmon (1997) como "camada de integrao e transformao". operational data store (ODS): Para Inmon (1997), ODS uma base de dados integrada, voltil, de valores correntes, e que contm somente dados detalhados. data warehouse (DW): Para Kimball (1998), a fonte de dados para consultas na organizao, ou seja, a unio de todos os Data Marts j constitudos. data mart (DM): Segundo Kimball (1998), que os data marts so subconjuntos de um DW completo. near line store (NLS): armazenagem complementar ao DW, a fim de manter

dados raramente acessados (INMON, 1997). exploration warehouse (EW): Para Inmon (1997), um ambiente ideal para anlises pesadas e inexploradas ainda por serem efetuadas, isolado do warehouse corporativo. metadados: Pode-se definir metadados como os dados que definem os elementos de dados da arquitetura BI. ETL: Sigla derivada de Extract, Transformation and Load, consiste no processo de busca dos dados de sua origem para serem utilizadas em um ambiente BI, sua transformao, padronizao e posterior carga no DW (ou DM ou ODS). OLAP: Advindo da expresso On-Line Analytic Processing, Kimball (1998), define como a atividade de consulta e apresentao de dados textuais e numricos em um DW. Drill: Operao de detalhamento (drill-down) ou agregao (drill-up, tambm conhecido como roll-up) em um processo OLAP (INMON, 1997).

31

3.1 EVOLUO DOS SISTEMAS DE APOIO DECISO

Para Inmon (1997), os Sistemas de Apoio Deciso tem origem com os computadores, porm evoluo principal ocorreu entre os anos 60 e 80, estando divididos em cinco fases, que so descritas abaixo: Inicio dcada de 1960, sistemas individuais, que faziam uso de arquivos principais (mestres), que eram armazenados em fitas magnticas; Em 1965 aproximadamente, devido complexidade tanto na criao e manuteno de programas, e o crescimento de arquivos mestres, surgiram enormes dificuldades devido necessidade de hardware; Em meados de 1970, surgiram os SGBDs ou Sistemas de Gerenciamento de Banco de Dados, e tambm um novo conceito que definia que todo o processamento deveria ser realizado sobre uma base nica, que o conceito de banco de dados. Alm disso, surgiu a tecnologia conhecida com direct access storage device (DASD) armazenamento em disco, que substituiu as fitas magnticas permitindo a criao dos SGBDs; J em 1975, surgiu o conceito de transaes online, ou seja, com as atualizaes instantneas nos SGBDs; Com todas as evolues anteriores por volta do incio dos anos 80, novas tecnologias apareceram como PC (Personal Computers Computadores Pessoais) e as L4Gs (Linguagens de Quarta Gerao), possibilitando a criao dos MIS (management information systems Sistemas de Informaes Gerenciais). Para Campos e Filho (1999), as aplicaes podem ser classificadas em dois grupos: 1. aplicaes do negcio: so as aplicaes que trabalham com o nvel operacional, que atendem ao dia a dia da empresa, conhecidos como sistemas de produo; 2. aplicaes sobre o negcio: so as aplicaes que permitem interpretar, analisar e definir estratgias, tambm conhecidos como Sistemas de Apoio Tomada de Decises (SAD) e Sistemas de Informaes Executivas (SIE-IES).

Segundo Campos e Filho (1999), a arquitetura ideal baseia-se em um ambiente de bancos de dados operacionais e outro para suporte s decises, conforme a figura 3:

32

Figura 3. Arquitetura de Dados Ideal (B.Boar, 1993 apud CAMPOS e FILHO,1999)

3.1.1 Dados Operacionais versus Dados Informacionais Sistemas de Apoio Deciso (SAD) e Sistemas de Informaes Executivos (SIE) apresentam funcionalidades e desempenho diferenciados dos sistemas de produo da empresa. (CAMPOS e FILHO, 1999): Sistemas de Produo: atendem a muitos usurios e o tempo de resposta fator crtico, geralmente trabalham com poucos registros; SAD e SIE: atendem a poucos usurios e o tempo de resposta no fator critico, utiliza-se uma grande quantidade de registros, tendo em vista que suas consultas so complexas e imprevisveis; SAD e SIE: devem apresentar dados consistentes, muitas vezes carregados de vrios sistemas de produo, so organizados permitindo a utilizao adequada de ferramentas de anlise dos dados, bancos de dados que dem suporte SAD e SIE devem ser capazes de oferecer um bom tempo de resposta para consultas que recuperam grandes conjuntos de dados agregados e histricos; SAD e SIE: normalmente lidam com tendncias, para isto so acompanhados do perodo a que se referem os dados.

33

Para Furlan (1994), os EIS ou SIE so desenvolvidos para servirem de consulta sem manipulao dos dados e atendendo aos executivos da empresa, enquanto os SADs so desenvolvidos para atenderem ao nvel gerencial, a figura abaixo apresenta as divises de nveis dos sistemas:

Estratgicos

EIS SISTEMAS DE INFORMAES EXECUTIVAS

Gerenciais

SAD- SISTEMA DE APOIO DECISO SIG SISTEMAS DE INFORMAES GERENCIAIS

Operacionais

FATURAMENTO, FOLHA PAGAMENTO, CONTABIL

Automao

AUTOMAO INDUSTRIAL, COMERCIAL DE ESCRITRIO

Figura 4 A Pirmide de Sistemas (FURLAN, 1994)

3.2 DATA WAREHOUSE

Este conceito consiste em organizar os dados corporativos da melhor maneira, oferecendo subsdio atravs de informaes aos gerentes e diretores das empresas para tomada de deciso. Tudo isso num banco de dados paralelo aos sistemas operacionais da empresa. Segundo Inmon (1997), o Data Warehouse so dados agrupados, modificado com o tempo, por atividade, no-voltil, utilizado no apoio a tomada de decises. Uma importante caracterstica do Data Warehouse a integrao. Para Souza (2004), data warehouse uma imensa base de dados no-voltil, organizada por assunto, integrada e varivel em relao ao tempo. Tambm pode ser definido como sendo a unio de tcnicas quem geram um sistema de dados que propiciam conhecimentos para tomada de decises. O desenvolvimento de sistemas de DW tem se tornado nos dias atuais uma grande rea de estudo e aplicao nas empresas. A possibilidade de acessar informaes confiveis com boa velocidade e garantia de qualidade de dados est cativando os diretores das

34

organizaes que cada vez mais necessitam de um controle mais efetivo dos dados da empresa sem depender de intermedirios para poder tomar suas decises (SOUZA, 2004). As informaes contidas nos tradicionais sistemas orientados transao no suprem as necessidades de consultas dos gerentes que precisam acessar longos perodos histricos, muitas vezes de vrios anos, os quais certamente no estaro disponveis nos sistemas utilizados para gerenciar as tarefas do dia-a-dia da empresa (SOUZA, 2004). Para Souza (2004) os bancos de dados so de vital importncia para as empresas e devemos observar que sempre foi difcil analisar os dados neles existentes. Tudo isso porque geralmente grandes empresas detm um volume enorme de dados e esses esto em diversos sistemas. No era possvel buscar informaes que permitissem tomarmos decises embasadas num histrico dos dados. Com este histrico podemos identificar tendncias e posicionar a empresa estratgicamente para ser mais competitiva e consequentemente maximizar os lucros diminuindo o ndice de erros na tomada de deciso.

dispem de habilidade para extrair, tratar e agregar dados de mltiplos sistemas operacionais em Data Marts ou data warehouses separados;

armazenam dados frequentemente em formato de cubo (OLAP) multi-dimensional permitindo rpido agregamento de dados e detalhamento das anlises (drilldown);

disponibilizam visualizaes informativas, pesquisando, reportando e modelando capacidades que vo alm dos padres de sistemas operacionais frequentemente oferecidos.

3.2.1 Arquitetura do Data Warehouse

Existem ferramentas para extrao de dados de diversas bases de dados operacionais e de fontes externas, ferramentas para limpeza, transformao e integrao destes dados, para carga de dados no DW e ainda outras para atualizao peridica do warehouse a fim de refletir as atualizaes ocorridas nas fontes (DATA WAREHOUSE 1999). Alm do DW podem existir vrios Data Marts (DMs), que departamentalizam os dados separando-os por setor dentro da organizao. Os dados contidos no DW e nos DMs so gerenciados por um ou mais servidores de warehouse, os quais apresentam vises multidimensionais dos dados para uma variedade de ferramentas front end.

35

Figura 5: Arquitetura Conceitual do Data Warehouse (CHAUDHURI, 1997)

A viso multidimensional em forma de cubo de dados indica que as informaes so visualizadas em linhas e colunas como o formato tradicional das planilhas, porm existem mais dimenses, sendo que o cubo teria apenas mais uma dimenso. Esta caracterstica organiza e facilita a consulta aos dados de maneira que se pode ter, por exemplo, numa dimenso do cubo os meses do ano, na segunda dimenso estariam s cidades de origem dos clientes e na terceira dimenso o mdico que encaminhou o cliente para o hospital. Finalmente, existe um repositrio para armazenagem e gerenciamento dos metadados acompanhados de ferramentas para monitorizao e administrao do sistema. 3.2.2 Modelo de Dados

Sendo o DW interativo de suma importncia o papel do modelo de dados. Quando os esforos de desenvolvimentos so baseados em um nico modelo de dados sempre que for necessrio unir estes esforos os nveis de sobreposio de trabalho e desenvolvimento desconexo sero muito baixos, pois todos os componentes do sistema estaro utilizando a mesma estrutura de dados (ANDREATTO, 1999).

3.2.2.1 Modelo de Dimenses

Segundo Andreatto (1999) obteno de respostas questes na anlise dos negcios de uma empresa, em geral, requer que os dados sejam visualizados de diferentes perspectivas. Por diversas vezes as questes levantadas podem ser respondidas atravs do ambiente tradicional de banco de dados, porm o tempo de resposta muito longo o tornam

36

ineficaz, sendo assim, buscou-se tecnologias que possam atender as necessidades de consultas deste tipo via acesso interativo aos bancos de dados. Teoricamente, quaisquer dados podem ser considerados multidimensionais. Entretanto, o termo normalmente se refere aos dados representando objetos ou eventos que podem ser descritos, portanto, classificados por dois ou mais de seus atributos. Estruturas relacionais podem ser usadas para a representao e o armazenamento de dados multidimensionais. Neste caso, as abordagens encontradas incluem desde a adoo de formas especficas de modelagem (os chamados esquemas estrela e floco de neve) at mecanismos sofisticados de indexao.

3.2.2.2 Os Esquemas do tipo Estrela e Floco de Neve


Em um esquema do tipo estrela ou "star" as instncias so armazenadas em uma tabela contendo o identificador de instncia, valores das dimenses descritivas para cada instncia, e valores dos fatos, ou medidas, para aquela instncia (tabela de fatos). Alm disso, pelo menos uma tabela usada, para cada dimenso, para armazenar dados sobre a dimenso (tabela de dimenso). No caso mais simples, a tabela de dimenso tem uma linha para cada valor vlido da dimenso. Esses valores correspondem a valores encontrados na coluna referente quela dimenso na tabela de fatos (ANDREATTO, 1999). Este esquema chamado de estrela, por apresentar a tabela de fatos "dominante" no centro do esquema e as tabelas de dimenses nas extremidades. A tabela de fatos ligada as demais tabelas por mltiplas junes, enquanto as tabelas de dimenses se ligam apenas a tabela central por uma nica juno. A Figura 6 mostra um exemplo de um modelo tipo estrela, onde as dimenses seriam as pontas das estrelas e a tabela de fatos o centro.

37

DIMENSO TEMPO

DIMENSO PACIENTE
Chave_paciente Nome Idade Sexo

Chave_tempo Dia Ms ano

FATOSONCOLOGICOS

Chave_tempo Chave_paciente Chave_diagnostico Tempo_tratamento

DIMENSO DIAGNOSTICO

Chave_diagnostico descricao

Figura 6 Modelo Estrela.

A tabela de fatos onde as medidas quantitativas ou valoradas do fato representado esto armazenadas. Cada uma destas medidas tomada segundo a interseo de todas as dimenses. No caso do exemplo, uma consulta tpica selecionaria fatos da tabela FATOSONCOLOGICOS a partir de valores fornecidos relativos a cada dimenso (ANDREATTO, 1999). Outro tipo de estrutura bastante comum o esquema do tipo floco de neve ou "snowflake", que consiste em uma extenso do esquema estrela onde cada uma das "pontas" da estrela passa a ser o centro de outras estrelas. Isto porque cada tabela de dimenso seria normalizada, "quebrando-se" a tabela original ao longo de hierarquias existentes em seus atributos. No caso do exemplo, a dimenso paciente possui uma hierarquia definida onde cidade se divide em estado e estado se divide em paciente (Figura 7). Da mesma forma, a dimenso tempo inclui ano que contem ms e ms que contem dia. Cada um destes relacionamentos muitos-para-um geraria uma nova tabela em um esquema floco de neve (ANDREATTO, 1999). DIMENSAO PACIENTE

Chave_Paciente Nome Idade Chave_Cidade

Chave_Cidade Nome CEP Chave_Estado

Chave_Estado Nome

UF

Figura 7 A dimenso do atendimento normalizada.

38

3.2.2.3 MOLAP - Multidimensional OLAP


Segundo Data Warehouse (1999), uma classe de sistemas que permite a execuo de anlises sofisticadas usando como gerenciador de dados um banco de dados

multidimensional. Em um banco de dados MOLAP os dados so mantidos em arranjos e indexados de maneira a prover um timo desempenho no acesso a qualquer elemento. O indexamento, a antecipao da maneira como os dados sero acessados, e ainda, o alto nvel de agregao dos dados, fazem com que sistema MOLAP tenha um excelente desempenho. Alm de serem rpidos, outra grande vantagem destes sistemas o rico e complexo conjunto de funes de anlise que oferecem. Na figura abaixo podemos verificar um Data Mart com trs dimenses utilizando um Banco de Dados Multidimensional onde as trs dimenses so: geografia (regio), produto e tempo:

Figura 8. Banco de Dados Multidimensional (CHAUDHURI, 1997)

3.2.2.4 ROLAP - Relacional OLAP


Sistemas ROLAP fornecem anlise multidimensional de dados armazenados em uma base de dados relacional. Atualmente existem duas maneiras de se fazer este trabalho: Fazer todo o processamento dos dados no servidor da base de dados. O servidor OLAP gera os comandos SQL em mltiplos passos e as tabelas temporrias necessrias para o processamento das consultas; Ou executar comandos SQL para recuperar os dados, mas fazer todo o processamento no servidor OLAP (DATA WAREHOUSE, 1999).

39

Alm das caractersticas bsicas de sistemas OLAP, servidores ROLAP devem tambm: Utilizar metadados para descrever o modelo dos dados e para auxiliar na

construo das consultas. Desta maneira um analista pode executar suas anlises utilizando seus prprios termos. Criar comandos SQL otimizados para os bancos de dados com o qual trabalha.

Para Data Warehouse (1999), a principal vantagem de se adotar uma soluo ROLAP reside na utilizao de uma tecnologia estabelecida, de arquitetura aberta e padronizada como a relacional, beneficiando-se da diversidade de plataformas, escalabilidade e paralelismo. 3.2.3 Granularidade

Para Inmon (1997), granularidade est vinculada ao nvel de detalhamento dos dados existentes no Data Mart ou Data Warehouse, quanto mais baixo o nvel de granularidade mais alto o nvel detalhamento. A granularidade influencia diretamente no volume de dados, bem como o tipo de consulta que pode ser realizada.

3.2.3.1 Estimativa Bruta


Segundo Inmon (1997), o nvel adequado de granularidade depende da identificao das tabelas e o nmero de registros que sero inseridos. Para Kimball (1998), quase sempre os dados devem estar expressos no menor nvel de granularidade, pela necessidade de se obter uma informao especfica.

3.2.3.2 Definio dos nveis de granularidade


Segundo De Toni (2000), a definio de granularidade pode gerar falta de detalhes necessrios ao usurio, ou ainda, falta de recursos para processar os dados, isto pode ocorrer pelo fato de haver poucas informaes (falta de detalhes), ou excesso de informaes que tornaria necessrio elevado uso de recursos de hardware para seu processamento. Segundo Inmon apud De Toni (2000), existem tcnicas para auxiliar no ciclo de definio da granularidade:

40

construir as primeiras partes do DW em passos muito pequenos e rpidos e ouvir cuidadosamente os comentrios dos usurios finais. usar prototipao se possvel, e permitir que o ciclo de feedback funcione usando observaes colhidas a partir do prottipo. verificar como outras empresas tem construdo o DW. trabalhar com usurios experientes. examinar tudo aquilo de que a empresa dispe no momento e que parece estar funcionando. realizar reunies com usurios e simular resultados.

3.2.3.3 Nveis duais de granularidade


Segundo Inmon (1997), para uma organizao com um grande volume de dados no Data Warehouse, necessrio avaliar a utilizao de dois ou mais nveis de granularidade, podendo ser necessrio mais de um nvel. Para Di Domenico (2001), a utilizao de dois nveis de granularidade, permite atender a processamentos levemente resumidos e tambm quando a necessidade de maior detalhamento. A Figura abaixo exemplifica a utilizao do nvel dual de granularidade.

Figura 9 - Nvel Dual de Granularidade (INMON, 1997).

41

3.2.4 Metadados Segundo Inmon (1997), os metadados so definidos como dados dos dados. S que a complexidade desses dados no DW aumenta muito. Num sistema OLTP (On-line Transaction Processing Processamento On-line de Transaes), gera-se documentos somente sobre o levantamento dos dados, banco de dados e o sistema que alimenta o mesmo. No DW alm do banco, gera-se uma documentao muito maior. Alm de falar sobre o levantamento de dados e o banco, temos ainda o levantamento dos relatrios a serem gerados, de onde vem os dados para alimentar o DW, processos de extrao, tratamento e rotinas de carga dos dados. Metadados podem ser gerados a partir de regras de negcio da empresa e todas as mudanas que elas podem ter sofrido, e tambm a frequncia de acesso aos dados. Segundo Inmon (1997), os metadados englobam o DW e mantm as informaes sobre onde est cada dado. Ele ainda define quais informaes os metadados mantm:

a estrutura dos dados segundo a viso do programador; a estrutura dos dados segundo a viso dos analistas de SAD (Sistemas de Apoio a Tomada de Decises); a fonte de dados que alimenta o DW; a transformao sofrida pelos dados no momento de sua migrao para o DW; o modelo de dados; o relacionamento entre o modelo de dados e o DW; o histrico das extraes de dados; dados referentes aos relatrios que so gerados pelas ferramentas OLAP (On-line Analytical Processing Processamento Analtico On-line) assim como os que so gerados nas camadas semnticas. Os metadados podem surgir de vrios processos durante o desenvolvimento do

projeto. Dentre as formas pode-se citar o repositrio de ferramentas case, os quais geralmente j esto estruturados, facilitando a integrao entre a origem e o repositrio dos metadados. Essa fonte de metadados riqussima. Outros dados que devem ser guardados no repositrio de metadados, o material que surgir das entrevistas com os usurios. Destas entrevistas podem-se obter informaes preciosas que no esto documentadas, alm de regras para validao dos dados aps carga do DW. Como o volume de metadados gerados muito grande, esto disponveis algumas ferramentas que fazem nica e exclusivamente o gerenciamento dos metadados. Estas possuem algumas caractersticas peculiares, de forma bem simples essas ferramentas conseguem mapear o dado em todas as etapas de desenvolvimento do projeto, desde a conceitual at a de visualizao dos dados.

42

De acordo com Inmon (1999), geralmente os metadados so apresentados em trs diferentes camadas: Metadados Operacionais: Definem a estrutura dos dados mantidos pelos bancos operacionais, usados pelas aplicaes de produo da empresa; Metadados Centrais: So orientados por assunto e definem como os dados transformados devem ser interpretados, devem incluir definies de agregao e campos calculados, bem como vises sobre cruzamentos de assuntos. Metadados do Nvel de Usurio: Organizam os metadados do DW para conceitos que sejam familiares e adequados ao usurio final. 3.3 DATA MART Inicialmente os projetos sobre DW referiam-se a uma arquitetura centralizada. Embora fosse interessante, pois fornece uniformidade, controle e maior segurana, a implementao desta abordagem no uma tarefa fcil. Requer uma metodologia rigorosa e uma completa compreenso dos negcios da empresa. Esta abordagem pode ser longa e dispendiosa e por isto sua implementao exige um planejamento bem detalhado. Com o aparecimento de data mart ou warehouse departamental, a abordagem descentralizada passou a ser uma das opes de arquitetura data warehouse. A data marts pode surgir de duas maneiras. A primeira top-down e a outra a botton-up.

Top-down: quando a empresa cria um DW e depois parte para a segmentao, ou seja, divide o DW em reas menores gerando assim pequenos bancos orientados por assuntos departamentalizados. Esta tcnica foi introduzida por Inmon, a figura abaixo demonstra esta tcnica:

Figura 10. Tcnica Top-down introduzida por Inmon

43

Botton-up: quando a situao inversa. A empresa por desconhecer a tecnologia, prefere inicialmente criar um banco de dados para somente uma rea. Com isso os custos so bem inferiores de um projeto de DW completo. A partir da visualizao dos primeiros resultados, parte para outra rea e assim sucessivamente at resultar um DW. Esta tcnica foi introduzida por Ralph Kimball, conforme demonstra a figura abaixo:

Figura 11: Tcnica Botton-Up introduzida por Kimball

A tecnologia usada tanto no DW como no Data Mart a mesma, as variaes que ocorrem so mnimas, sendo em volume de dados e na complexidade de carga. A principal diferena a de que os Data Marts so voltados somente para uma determinada rea, ou ainda departamental, j o DW voltado para os assuntos da empresa toda. O maior atrativo ao implementar um data Mart o seu custo e prazo. 3.4 ETL- EXTRAO, FILTRAGEM E CARREGAMENTO O processo de carga dos dados dos sistemas operacionais para o DW ou DM, passam por trs etapas: extrao, filtragem e carga. A figura 12 abaixo demonstra o processo de utilizao do ETL:

Figura 12 Processo de utilizao da ETL

44

3.4.1

Extrao

A extrao dos dados um processo critico, levando em considerao que muitas vezes os dados so transferidos de banco de dados hierrquicos para SGBDs, ou ainda de arquivos texto, planilhas. Tambm ocorrem casos onde necessrio agrupar e desagrupar dados para atender aos requisitos do DW (ANDREATTO, 1999).

3.4.2

Filtragem

A filtragem consiste em colocar todos os dados em um padro pr-estabelecido (ANDREATTO, 1999).

3.4.3

Carga

A carga dos dados ainda, deve passar pela verificao das integridades dos dados, como consistncia de chaves primrias, chaves estrangeiras (relacionamentos)

(ANDREATTO, 1999).

3.5 POVOANDO O DATA WAREHOUSE

Para Campos e filho (1999), a extrao, limpeza, transformao e migrao de dados dos sistemas existentes para o DW so atividades crticas e que determinam o funcionamento de forma eficiente. Apesar de existirem ferramentas que auxiliam na deteco de problemas na qualidade dos dados e geram programas de extrao. A maioria das informaes necessrias para o desenvolvimento de regras para o mapeamento e transformao est apenas na cabea dos analistas e usurios. Alm destes, outros fatores influenciam na estimativa de tempo para as atividades, que so o nmero de fontes e a qualidade dos metadados. Tambm existe outra importante preocupao que so: validao de domnios, regras de derivao e dependncias entre elementos de dados. Se estas regras tiverem de ser extradas do cdigo fonte das aplicaes, o tempo para mapeamento e integrao pode dobrar. 3.5.1 Extrao

Para Campos e filho (1999), existem vrias alternativas que possibilitam balancear desempenho, restries de tempo e de armazenamento. Uma forma consiste em submeter

45

consultas diretamente ao banco de dados, podendo ocasionar uma queda de desempenho devido ocorrncia de transaes concorrentes. As rotinas de extrao devem ser capazes de isolar somente aqueles dados que foram inseridos e atualizados desde a ltima extrao, este processo conhecido como refresh. Para DalAlba (1999), a melhor poltica de refresh deve ser avaliada pelo administrador do DW, que deve considerar caractersticas como: necessidades dos usurios finais, trfego na rede e perodos de menor sobrecarga, tanto das origens dos dados quanto do DW. 3.5.2 Transformao e filtros

Aps a extrao dos dados e a insero dos mesmos em uma rea temporria, estes devem ser tratados, passando por uma limpeza e filtragem, onde o objetivo garantir a integridade atravs de programas e/ou rotinas que identifiquem distores e faam o tratamento adequado, garantindo que os dados estejam consistentes antes de serem inseridos no DW. Esta limpeza tem como objetivos detectarem: erros de digitao; violaes de integridade; caracteres desconhecidos; falta de padronizao de abreviaes. Uma outra etapa consiste em aplicar uma metodologia de comparao de representaes, que inclua critrios de identificao de semelhanas e conflitos de modelagem, sendo estes divididos em: semnticos e estruturais. Conflitos semnticos so aqueles envolvendo o nome ou palavra associada s estruturas de modelagem, por exemplo, mesmo nome para diferentes entidades ou diferentes nomes para a mesma entidade. Conflitos estruturais englobam os conflitos relativos s estruturas de modelagem escolhidas, tanto no nvel de estrutura propriamente dito como no nvel de domnios. Os principais tipos de conflitos estruturais so os conflitos de domnio de atributo que se caracterizam pelo uso de diferentes tipos de dados para os mesmos campos. Conflitos tpicos de domnio de atributo so: diferenas de unidades; diferenas de preciso; diferenas em cdigos ou expresses; diferenas de granularidade; diferenas de abstrao.

46

Para DalAlba (1999), depois de identificados os conflitos de modelagem, deve-se criar as regras de mapeamento de representaes equivalentes e de converso para os padres estabelecidos pelo DW. 3.5.3 Derivao e Sumarizao

Para Campos e Filho (1999), podemos derivar os dados durante o processo de carga e armazenamento no ambiente relacional corporativo, uma outra opo est em derivar quando o servidor de replicao distribui os dados para os DW, ou ainda, derivar os dados quando o usurio submeter uma consulta ou lanar uma simulao. 3.6 OLAP (ON-LINE ANALYTIC PROCESSING)

3.6.1

Introduo e Conceitos

A sigla OLAP deriva de On-Line Analytic Processing uma contraposio a OLTP de On-Line Transaction Processing, correspondendo a duas modalidades de processamento: Processamento analtico on-line e processamento de transao on-line. De acordo com Baptista (2001), antes de ser uma tecnologia, OLAP um rtulo. aplicada aos softwares que permitam de forma simples execuo de consultas e anlise de dados utilizados no processamento de informaes de apoio a deciso. Para Kimball (1998) apud Baptista (2001), afirma ser OLAP um termo inventado para descrever uma abordagem dimensional para o suporte a deciso. Segue um alinhamento com o modelo dimensional tambm conhecido com esquema tipo estrela. Para Baptista (2001), a filosofia OLAP, ainda necessita de critrios mais especficos para ser aceita como padro de comparao para sistemas de suporte deciso. Para Bispo (1999) apud Baptista (2001), OLAP so tecnologias que do suporte aos usurios (analistas, gerentes, executivos), no processo decisrio atravs do uso de consultas, anlises e clculos dos dados corporativos, estejam estes armazenados em DW ou no. Para Baptista (2001), os sistemas OLAP so projetados com o objetivo de auxiliar no processo de tomada de decises e em planejamentos estratgicos, atravs de consultas utilizadas por determinadas reas de uma organizao. 3.6.2 Caractersticas gerais

De acordo com Baptista (2001), os aplicativos ou ferramentas OLAP em geral executam cinco funes bsicas:

47

interface as telas e mtodos usados para direcionar instrues internas a outras funes baseadas nas selees dos usurios; consulta - a lgica do aplicativo usada para gerar o cdigo SQL; processo a lgica do aplicativo que executa a anlise de dados no conjunto de resultados retornado pela consulta ao banco de dados; formato a lgica do aplicativo requerida para rotular propriamente linhas e colunas de dados e criar um arquivo padro; exibio apresentao do arquivo formatado, como relatrio ou grfico, para visualizao pelo usurio.

Para Baptista (2001), geralmente o OLAP se refere a quatro capacidades computacionais analticas:

consulta e relatrio oferecem o esquema bsico de anlise de dados OLAP, geralmente compatveis com os recursos dos Sistemas Gerenciadores de Bancos de Dados. Facilitam a especificao de consultas adhoc e proporcionam rica formatao de relatrios e recursos grficos. Interface padro Windows;

anlise multidimensional emprega funes mais complexas, permitindo que os usurios entrem em qualquer dimenso do banco Data Warehouse e trafeguem livremente por todas as outras;

anlise estatstica trabalha com um nvel de complexidade ainda maior, podendo calcular mdias e outras formas estatsticas mais sofisticadas como regresso, correlao, fatorao e agrupamentos;

data mining acrescenta funes mais complexas como redes neurais para identificao de modelos e relaes e algoritmos de aprendizado para trabalhar com previses.

Para Baptista (2001), as estruturas de aplicativo OLAP subdividem a aplicao em camadas cabendo a cada qual uma parte importante no conjunto:

camada de dados responsvel pela aquisio dos dados; camada lgica responsvel pelas funes de consulta, processo e formato; camada de apresentao responsvel pelas tarefas de interfaceamento e exibio.

Segundo Baptista (2001), as ferramentas OLAP podem ser construdas a partir de dois esquemas estruturais diferenciados:

48

aplicativos em duas camadas tradicionalmente usado em solues cliente/servidor neste tipo de aplicativo a primeira camada executa as funes de apresentao (interface e exibio) e de processamento (consulta e formatao) e funciona como um programa simples instalado no lado cliente da relao cliente/servidor. O banco Data Warehouse corresponde segunda camada e executa o papel de servidor de dados. A figura 13 ilustra uma estrutura de duas camadas tpicas.

Figura 13 Estrutura de aplicativo em duas camadas

aplicativos em trs camadas uma nova tcnica de estruturar os aplicativos OLAP, mais direcionada para intranets, desloca total ou parcialmente as funes da camada lgica para servidores de aplicativos, formando um esquema de trs camadas, conforme mostrado na figura 14.

Figura 14 Estrutura de aplicativo em trs camadas

49

3.7 DATA MINING

Conforme Pereira (1999), no inicio do DW, Data Mining era visto como parte das atividades do warehouse, porm atualmente os caminhos do DW e do DM esto divergindo. Enquanto o DW pode ser uma boa fonte de dados para minerar, o DM foi reconhecido como uma atividade nica, e no mais como uma parte do DW. Mesmo com a popularizao do Data Mining, ainda existe muitas divergncias quanto a sua definio.
Data Mining (ou minerao de dados) o processo de extrair informao vlida, previamente desconhecida e de mxima abrangncia a partir de grandes bases de dados, usando-as para efetuar decises cruciais. Data Mining vai muito alm da simples consulta a um banco de dados, no sentido de que permite aos usurios explorar e inferir informaes teis a partir dos dados, descobrindo relacionamentos escondidos no banco de dados. Pode ser considerada uma forma de descobrimento de conhecimento em bancos de dados (KDD - Knowledge Discovery in Databases), rea de pesquisa de bastante evidncia no momento, envolvendo Inteligncia Artificial e Banco de Dados (CAMPOS E FILHO, 1999).

Para Pinheiro (1999), consiste em um ambiente de apoio tomada de decises, integrando tcnicas de DM sobre um ambiente de DW, possibilitando um vasto nmero de aplicaes, que j esto sendo implementadas em diversas reas buscando identificar perfis dos consumidores, seguros, deteco de fraude, dentre outros. Para Data Warehouse (1999) DM pode ser aplicado com os seguintes objetivos: explanatrio: demostrar algum evento ou medida observada; confirmatrio: confirmar uma hiptese; exploratrio: analisar os dados buscando relacionamentos novos e no previstos. Para Bigolin (2000), DM o processo de descobrir conhecimentos que visam identificar padres definidos atravs de bancos de dados com grandes volumes de dados.

50

3.7.1 O processo de Data Mining Para Data Warehouse (1999) existem trs classes de Data Mining: descobrimento, modelagem de prognstico e anlise prvia. Descobrimento consiste em identificar padres ocultos sem a existncia de uma idia ou hiptese, em sntese o programa encontrar padres sem que o usurio tenha uma idia prvia. Na modelagem de prognstico, consiste em gerar expectativas futuras utilizando-se de padres identificados no banco de dados. Para Data Warehouse (1999), enquanto o processo de descobrimento encontra padres em dados, o processo de modelagem de prognstico aplica estes padres para supor valores nos novos itens de dados. A anlise prvia a utilizao dos padres encontrados para identificar anomalias ou elementos de dados raros. Ainda para Data Warehouse (1999) existem trs tipos de atividade de data mining em um ambiente corporativo: episodic mining, strategic mining e continuous mining. Episodic Mining: busca dados de uma situao especfica, para entender este conjunto de dados ou us-lo para prognstico de novas situaes similares. Strategic Mining: consiste em analisar um conjunto largo de dados com a intenso de obter conhecimento global de uma situao especifica. Exemplo: Quais os hbitos dos pacientes com diagnstico de cncer de pele? Continuous Mining: identifica quais fatores determinaram uma alterao em determinado perodo e o que o ocasionou a mesma. 3.7.2 Tcnicas de Data Mining O uso das tcnicas de DM possibilitam a identificao de padres e tendncias, permitindo a visualizao e avaliao destes. Segundo Freitas Junior apud Sonza (2002), a familiaridade com as tcnicas necessria para proporcionar a melhor abordagem de acordo com os problemas

51

apresentados. Portanto, para cada classe de aplicao deve-se aplicar um conjunto de algoritmos com o objetivo de extrais padres e relaes dentro de uma base de dados. Para Bispo (1999), as tcnicas que utilizamos so continuidade natural de generalizaes e metodologias analiticas que j so conhecidas h anos. Entre as tcnicas de DM pode-se citar: associao, sries temporais similares, classificao e regresso, clusterizao, rvores de deciso e visualizao.

3.7.2.1 Associaes
Para Data Warehouse (1999), so relacionamentos significativos entre itens e dados armazenados. O objetivo deste tipo de operao encontrar tendncias que so detectadas pelo grande nmero de transaes que possam ser usadas para entender e explorar padres de comportamento dos dados. So informaes similares anteriormente desconhecidas, no bvias e que podem ser interpretadas por um especialista no assunto (NETO, 2001). Segundo Dw Brasil (2000), as regras associativas so iguais as de classificao, diferenciando-se pela capacidade de predizer caractersticas comuns. Para DW Brasil (2000), suporte a quantidade de instncias para a qual a regra associativa verdadeira, e a exatido proporo entre as instncias verdadeiras e todas as instncias correspondentes. bastante comum determinar a exatido mnima e apresentar apenas a regra mais forte para o usurio, evitando com isso a produo de um grande nmero de regras.

3.7.2.2 Sries Temporais Similares


Identificam sries similares que esto armazenadas na base de dados e que variam de forma semelhante ao longo de um perodo de tempo. (DATA WAREHOUSE, 1999). Para Dw Brasil (2000), so modelos matemticos clssicos que demonstram o comportamento dos dados, necessitando o envolvimento de usurios experientes na construo destes modelos.

52

3.7.2.3 Classificao e regresso


Para Data Warehouse (1999), classificao e regresso utilizam dados armazenados para criar modelos de comportamento variveis.
criado um conjunto de treinamento", denominao dada a um grupo inicial de registros que so tomados como padro, classificando-se os demais registros a partir destes padres. Uma vez definido o padro de comportamento das variveis, pode-se determinar quais registros esto fora deste padro e ainda assim saber o prprio distanciamento deste padro, o que pode confirmar e de certa forma explicar a verificao de algumas anomalias (DATA WAREHOUSE ,1999).

Para Carvalho (2001), a classificao uma tcnica mais utilizada simplesmente por ser uma das tarefas cognitivas humanas mais realizada no auxilio a compreenso do ambiente em que vivemos.

3.7.2.4 Clusterizao
Data Warehouse (1999) define clusterizao como sendo a informao disponvel e segmentada em conjuntos definidos, homogneos e baseados em atributos especficos. Este conceito j conhecido em diversas reas, porm, em Data Mining passou por uma especializao a fim de permitir a sua aplicao em itens no numricos. Neste tipo de algoritmo no informado ao sistema os tipos de classes existentes, ficando a cargo do computador descobrir classes a partir das alternativas encontradas na base de dados. Para Gimenes (2000), a proposta da clusterizao basicamente endereada a problemas de segmentao, na qual se faz um corte de um grande nmero de atributos em pequeno conjunto de grupos ou segmentos.

3.7.2.5 rvores de Deciso


Segundo Data Warehouse (1999), rvores de deciso so formas de representar os resultados obtidos pelo DM, que se parecem com os grficos organizacionais horizontais. A rvore montada atravs de ndulos que foram comparados a determinada constante. Para Data Warehouse (1999), entre as principais vantagens das rvores de deciso a clareza em que a grande maioria das pessoas consegue interpretar seus resultados, pois leva em considerao as regras que so mais importantes.

53

3.7.2.6 Visualizao
Para Data Warehouse (1999), a visualizao organiza os dados conforme as dimenses definidas. Esta tcnica pode ser utilizada em vrios momentos da minerao, permitindo a seleo de dados, exibir resultados, e ainda minerar, quando utilizada em conjunto com uma ferramenta adequada de explorao interativa.

3.7.2.7 Redes Neurais


Para Data Warehouse (1999), esta tecnologia a que oferece o mais profundo poder de minerao, mas tambm a mais difcil de entender. As redes neurais tentam construir representaes internas de modelos ou padres encontrados nos dados, mas essas representaes no so apresentadas para o usurio. Com elas, o processo de descoberta de padres tratado pelos programas de DM dentro de um processo caixa-preta. Estruturalmente, uma rede neural consiste em um nmero de elementos interconectados (chamados neurnios) organizados em camadas que aprendem pela modificao. Geralmente constroem superfcies equacionais complexas atravs de interaes repetidas, cada hora ajustando os parmetros. Depois de muitas repeties, uma superfcie pode ser internamente definida que se aproxima muito dos pontos dentro do grupo de dados. A funo bsica de cada neurnio : (a) avaliar valores de entrada, (b) calcular o total para valores de entrada combinados, (c) compara o total com um valor limiar, (d) determinar o que ser a sada. Enquanto a operao de cada neurnio razoavelmente simples, procedimentos complexos podem ser criados pela conexo de um conjunto de neurnios. Tipicamente, as entradas dos neurnios so ligadas a uma camada intermediria (ou vrias camadas intermedirias) que ento conectada com a camada de sada.

3.7.2.8 Induo de Regras


Segundo Data Warehouse (1999), a Induo de Regras, ou Rule Induction, se refere deteco de tendncias dentro de grupos de dados, ou de regras sobre o dado. As regras so, ento, apresentadas aos usurios como uma lista no encomendada. Vrios algoritmos e ndices so colocados para executar esse processo, incluindo o Gini, o C 4.5 e o CHAID. Na IR, a grande maioria do processo feito pela mquina, e uma pequena parte feita pelo usurio.

54

Por exemplo, a traduo das regras para dentro de um modelo aproveitvel feito pelo usurio, ou por uma interface de rvores de deciso. Do ponto de vista do usurio, o maior problema com as regras que o programa de DM no faz o ranking das regras por sua importncia. O analista de negcio ento forado a encarregar-se de criar um manual de anlise para todas as regras relatadas a fim de determinar aquelas que so mais importantes no modelo de DM, e para os assuntos de negcio envolvidos. E isso pode ser um processo tedioso. O objetivo deste captulo foi abordar Business Intelligence, destacando a evoluo dos sistemas de apoio deciso, o tema Data Warehouse, Data Mining e suas tcnicas. No prximo captulo ser apresentado o modelo atual e o prottipo desenvolvido com base no estudo realizado.

55

MODELO ATUAL

Este captulo tem como objetivo principal conhecer o ambiente onde o estudo est sendo proposto, e com base nestas informaes ser possvel apresentar o modelo que dar origem ao prottipo. 4.1 CONTEXTUALIZAO DO AMBIENTE

O HRO possui na rea de Tecnologia da Informao 83 microcomputadores, interligados em rede, utilizando-se de cabeamento par traado categoria 5, 100 MBits (Mega Bits por Segundo)., com placas de rede fast ethernet. Como servidores a Seo de Tecnologia da Informao (STI) possui: 01 servidor com sistema operacional Novell 4.11, onde, centralizado o sistema de gesto mdulos de atendimento (recepo), suprimentos, faturamento, financeiro, contabilidade. Um servidor linux para internet e 01 servidor linux para sistemas de apoio (Manuteno, Lavanderia, Refeitrio, etc...). A rea de Recursos Humanos tambm possui um servidor exclusivo integrando com a rea financeira e contbil. Os servios oncolgicos possuem atualmente os seguintes equipamentos, conforme tabela abaixo:
Tabela 1: Relao de Equipamentos dos Servios de Oncologia

Setor Quimioterapia - R.Cncer

Especificaes

Sist. Oper.

Memria 128 MB

Hd 10 GB

Proc. DURON 1300

Microcomputador Win 2000 LEXMARK Impressora 3200 Estabilizador Monitor Teclado Microcomputador WIN 95 Impressora LX 300 Nobreak Monitor Teclado Microcomputador WIN 95 Impressora LX 300 Estabilizador

Quimioterapia - Recepo

32 MB

1.2 GB PENTIUM 166

Quimioterapia Farmcia

32 MB

1.7 GB PENTIUM 75 Continua

56

Continua

Monitor Teclado PENTIUM III 750

Radioterapia - Recepo

Microcomputador WIN 98 Impressora HP 710 Nobreak Monitor Teclado

64 MB

20 GB

Radioterapia - Dr Rodrigo

Microcomputador WIN 98 Monitor Teclado

64 MB

20 GB

PENTIUM III 750

Radioterapia - Fsico

Microcomputador WIN 98 Monitor Nobreak Teclado

64 MB

20 GB

PENTIUM III 750

Radioterapia - Dr Poli

Microcomputador WIN 98 Monitor Teclado

64 MB

20 GB

PENTIUM III 750

4.1.1 Histrico do Hospital Regional do Oeste A ASSOCIAO HOSPITALAR LENOIR VARGAS FERREIRA, uma Associao civil, fundada em 26 de agosto de 1997, com seus atos constitutivos registrados no livro A 9 sob o n. 2.380 no Cartrio de Registros de Ttulos e Documentos da Comarca de Chapec SC, sem fins lucrativos e de fins filantrpicos. A Associao utiliza o nome fantasia HOSPITAL REGIONAL DO OESTE - HRO. Constitui misso da Associao: promover gratuitamente, assistncia sade, administrando o Hospital Regional Lenoir Vargas Ferreira, dentro dos preceitos ticos e legais, visando sempre o benefcio da comunidade, em cada caso, estabelecendo regimento apropriado de acordo com as respectivas particularidades e natureza que permitam apoiar as polticas pblicas, objetivando:

I.

Prestar servios de excelncia para a melhora na qualidade de vida do cidado, visando elevao do nvel de sade da populao, atravs de atividades de fins no econmicos;

57

II.

Promover o desenvolvimento de programas de sade de mbito nacional, estadual e municipal de interesse pblico, voltada principalmente para os segmentos de sade;

III.

Apoiar o desenvolvimento de programao na rea de sade voltada prestao de servios essenciais populao de baixa renda;

IV.

Promover a integrao com entidades afins, buscando permanente cooperao tcnica para o alcance de objetivos comuns.

Visando ao desenvolvimento e o incremento de suas finalidades, poder a Associao firmar convnios com Entidades que desenvolvam atividades relacionadas com seus objetivos, observadas as disposies legais aplicveis. Segundo o Estatuto Social do HRO (2004), a estrutura administrativa e organizacional composta pelos seguintes rgos, conforme pode ser visualizado na Figura 15: Assemblia Geral, Conselho Fiscal, Coordenao Executiva e Coordenao Tcnica. A Assemblia Geral instncia mxima e soberana do grupo, sendo constituda por todos os membros fundadores efetivos e especiais, obedecendo s normas previstas no Estatuto. 4.1.2 Organograma

Na Figura 15 representado o organograma do Hospital Regional do Oeste, aprovado pelo Conselho de Administrao em 13/04/2004.

58

Asse m bli a Ge ral C o nselho F isc al C o nselh o de A dm in istr ao A ud ito ria D iretor ia E xecu tiv a
Com is s o Con trole In fec o Hos p italar

D ir eto r C lnico
A ss es s oria de M ark etin g e Com un ica o

A ss oc ia o V olun t rios HR O

A ssesso ria J urid ic a D ireto r G e ral

Se cretaria G er al

P asto ral d a Sa de

D ireto r En ferm ag em

D iretor A dm /F in a nc eiro

D ire to r T cnico

Ser vio s de En ferm ag em

Se rv i os A dm inistr ativ o s

Ser vio s d e A p o io

S erv io s de S AD T

Se rv i os d e M dico s

Ser vio C ontr ole I nfe c o Hos pitalar

Ce ntr al d e Capt a o e Tr an s p lante d e r g os

S eo de B er ario Se o d e C en tro C ir rg ic o Se o d e C en tro O b sttric o Se o de C lin ica M dica A e B Se o de C M E

S e o C o m erc ial S eo C o ntab il. F in ance ir a Se o de F atura m ento Se o de M a teriais Se o R e cu rsos H u m ano s
S e o d e Tecn olog ia da I nform a o

Se o de Con tr. e S eg ur . P atrim onial

Se o d e A n at. P ato l gico S eo de B a nco de S ang ue Se o de F isio ter ap ia Se o de H em o d ilise Se o de Im ag e m Se o de L abo r at rio S eo T r aa do s G rafico s

S eo d e A ne stesia S eo de C li n. C ir rg ica S eo de C li n. M d ic as S eo de C li n. P ed iatrica Se o G inec o /O b stetricia S eo N eu ro . N e uro ciru rg ia Se o d e P ro nto S o co rro S eo d e Trau m ato lo g ia

Se o H ig ie n e e L im pez a S eo de M an ute n o Se o N u trio e D iettic a S e o P r oc ess. d e R o u p as

Se o de C lin ica C ir rg ic a Se o de C ln ica P ed itr ic a Se o de C lin ica O n co l g ica S eo de M ater nid ad e S eo de P riv ativ a Se o d e P S A m b u latr io S eo de Q u im io terap ia S eo de R ad io ter api a S eo d e Tr at. D ep . Q u im ic a Se o d e U .T .I

Se o de U .T .I

L ege nd a: S ervi os de T erc eiros A ssessoria

H O SP IT A L R E G I O N A L D O O E ST E A S S O C I A O H O S P I T A LA R L E N O IR V A R G A S F E R R E IR A A p ro v a d o p elo C o ns e lh o d e A dm in is tra o e m 1 3 / 0 4 / 2 0 04

Figura 15: Organograma Hospital Regional do Oeste

Na Figura 15 os servios em destaque so relacionados aos de oncologia do Hospital Regional do Oeste permitindo observar a complexidade e a necessidade da interao entre estes, permitindo que todo e qualquer conhecimento seja utilizado de forma eficiente.

59

Alguns servios que so realizados pelos profissionais de enfermagem, como enfermeiras, tcnicos de enfermagem e auxiliares compem esto subordinados ao Diretor de Enfermagem que por sua vez subordinado ao Diretor Geral, tambm encontramos outros que so subordinados aos servios mdicos, que esto subordinados ao Diretor Tcnico que por sua vez subordinado ao Diretor Geral, alm de servios de apoio que esto subordinados ao Diretor Administrativo que subordinado ao Diretor Geral. Assemblia Geral a instncia mxima na estrutura hierrquica da instituio. O Conselho Fiscal aparece na seqncia, a Auditoria presta assessoria ao Conselho de Administrao, a Diretoria Executiva tem assessoria da Comisso de Controle de Infeco Hospitalar, Marketing e Comunicao, Associao de Voluntrios, Diretor Clinico e Jurdico. O Diretor Geral tem assessoria da Pastoral de Sade e Secretria Geral. Esto subordinados ao Diretor Geral: o Diretor de Enfermagem, Diretor Administrativo/Financeiro e Diretor Tcnico. O Diretor de Enfermagem responsvel pelos servios de enfermagem, que atendem as diversas clinicas de internao, como: maternidade, UTI, clinica mdica, entre outras. O Diretor Administrativo/Financeiro responsvel direto pelos servios administrativos, dentre os quais pode destacar: contabilidade, faturamento, tecnologia da informao, entre outros. Tambm administra o servio de apoio, onde se encaixa: nutrio, manuteno, higiene, entre outros. responsvel pelos servios de apoio ao tratamento e diagnstico, onde esto inclusos os servios terceirizados como: laboratrio, banco de sangue e servio de imagem. O Diretor Tcnico responsvel pelos servios mdicos, dentre os quais a ala cirrgica, anestsica, entre outros. O Servio de Controle de Infeco Hospitalar e Servio de Captao de rgos tambm so subordinados ao Diretor Tcnico. 4.2 FLUXO DE INFORMAO ATUAL

O Servio de Oncologia do HRO consiste em vrias atividades que visam ao bemestar e melhora dos pacientes portadores de cncer, estando entre os principais servios o tratamento clnico, cirrgico, radioterpico, quimioterapico, sendo estes servios oferecidos por mdicos oncologistas, radioterapeutas, clnicos gerais, cirurgies, alm dos profissionais mdicos outros profissionais participam efetivamente do tratamento, entre eles esto os enfermeiros, auxiliares de enfermagem e tcnicos de enfermagem. Durante o tratamento faz-

60

se necessrio o acompanhamento psicolgico, nutricional e de assistncia social, envolvendo vrios profissionais, o que torna essa atividade multidisciplinar. Atualmente o fluxo existente inicia com o encaminhamento do paciente ao Servio de Quimioterapia, atravs de uma prescrio relatando o motivo do encaminhamento e com exames realizados que confirmem ou indcios que caracterizem sintomas do cncer. Os pacientes so cadastrados pela recepo deste servio e encaminhados ao mdico oncologista, que avalia os exames recebidos e pode ou no solicitar novos exames para identificar o grau da doena, ou ainda, que permita a confirmao do diagnstico. Aps a identificao o mdico oncologista vai determinar qual o tipo de tratamento ser utilizado no tratamento deste paciente, este processo pode incluir o radioterapeuta que recebe o paciente encaminhado pelo mdico oncologista, faz uma avaliao encaminha para avaliao nutricional e psicolgica. Em caso de confirmada a necessidade de utilizao da radioterapia este paciente encaminhado ao fsico-mdico que faz uma avaliao e simulao das aplicaes de radiao, visando o melhor tratamento possvel sem que ocorra uma rejeio pelo organismo do paciente. Este processo realizado atravs de incidncias peridicas, bem como consultas com o mdico oncologista e o mdico radioterapeuta. Durante o tratamento pode se fazer necessria interveno cirrgica, acompanhada de radioterapia e quimioterapia. Todo este processo acompanhado por avaliaes de enfermagem, nutricionistas, psiclogas e assistentes sociais. A Figura 16 demonstra de o fluxo dos servios oncolgicos do Hospital Regional do Oeste.

61

Figura 16: Fluxo de Dados da Oncologia

62

4.3

ANLISE DO SISTEMA EXISTENTE

O processo de anlise do sistema existente foi realizado atravs de entrevistas e coleta de documentos. Durante este processo percebeu-se que existe uma grande deficincia de um sistema transacional (OLTP) que permita o lanamento dos registros e acompanhamentos dos procedimentos, exames e avaliaes coletadas durante todo o tratamento. O reflexo da falta de um sistema OLTP a inexistncia de informaes que permitam anlises e estratgias apoiadas por um sistema de apoio tomada de decises. Esta realidade condiz com a maioria dos hospitais de nossa regio, estado e pas que tem dificuldades para gerenciar e aprimorar os seus servios atravs da utilizao de sistemas de apoio tomada de decises. 4.4 LEVANTAMENTO DE REQUISITOS

Durante o processo de fundamentao terica e pesquisa do ambiente foram determinados requisitos importantes para elaborao do prottipo. Abaixo so relatados os principais requisitos obtidos
Tabela 2: Lista de Requisitos

No 01 02

Requisito Definio de Ambiente Criao de

Descrio O ambiente configurvel e determinado pelo usurio

Tabela, Permitir que as tabelas, atributos, relacionamentos e

Atributos, Relacionamento e regras para transformao possam ser definidas pelo Transformaes. 03 Extrao usurio. Permitir insero de dados diretamente no prottipo, bem como importar de arquivos Dataflex e tambm arquivos texto. Os dados extrados devem ser carregados para uma rea de estagiamento.

63

04

Transformao

Os dados devem passar pelo processo de limpeza e transformao na rea de estagiamento.

05

Carga

Os dados devem ser carregados para o ambiente definido disponibilizando dados para consulta.

06 07

Visualizao Minerao

Consulta atravs de Grficos e tabelas configurveis. Disponibilizar Tcnicas de minerao como: rvore de deciso, clusterizao e visualizao.

08

Restringir Tamanho da Base Disponibilizar formas de filtragem visando restringir a de Dados quantidade de dados a serem lidos nas consultas e visualizaes.

4.5

CONSIDERAES FINAIS DO CAPTULO

Este captulo teve como objetivo estudar a instituio onde o trabalho foi desenvolvido, destacando o ambiente na rea de tecnologia da informao, o histrico do Hospital Regional do Oeste, avaliao da estrutura organizacional para indicar o enfoque do trabalho, o fluxo de informao atual, bem como uma avaliao sobre o sistema de informao no servio de oncologia. No prximo captulo ser dado enfoque as tecnologias utilizadas e tambm ao prottipo.

64

DESENVOLVIMENTO DO PROTTIPO

Este captulo tem por objetivo descrever sobre as ferramentas e a apresentao do prottipo, utilizando como base a reviso bibliogrfica. As especificaes coletadas no levantamento de requisitos constituram a base para validao do prottipo. 5.1 FERRAMENTAS UTILIZADAS

Para desenvolvimento do prottipo foram utilizadas as ferramentas: Visual Dataflex e o gerador de relatrios Crystal Reports. 5.1.1 Visual Dataflex

O Visual Dataflex uma ferramenta desenvolvida pela Data Access Corporation, base em ambiente Windows. Fazem parte do ambiente de desenvolvimento do Visual Dataflex um Ambiente Integrado de Desenvolvimento IDE, o utilitrio para definio dos arquivos da base de dados e o dicionrio de dados (Database Builder), o Winprint, um Utilitrio grfico programvel de impresso, o Database Explorer (ferramenta para pesquisa no Banco de Dados) (RODRIGUES, 1999). Para Rodrigues (1999), uma das principais caractersticas do Visual Dataflex a produtividade, podendo o ambiente de desenvolvimento ser configurado oferecendo uma maior comodidade na criao dos aplicativos. Podendo com a reutilizao de cdigo reduzir o tempo de desenvolvimento de aplicaes. Conforme Visual Dataflex (2004), as principais caractersticas da ferramenta so: a criao de aplicaes para Windows e Web rapidamente; aumentar as funcionalidades das aplicaes utilizando as mais recentes tecnologias; conectar as aplicaes aos principais bancos de dados da indstria; distribuir facilmente as aplicaes em pequenas e grandes corporaes; gerenciar todo ambiente com total controle e transparncia;

65

arquitetura 3 camadas.

Como desvantagens do Visual Dataflex, tem-se: - conexo com Sistemas Gerenciadores de Banco de Dados que no o nativo, necessariamente so realizados com drives especficos. - toda tecnologia paga, tanto de desenvolvimento como aplicativos de conexo com Sistemas Gerenciadores de Bancos de Dados. 5.1.2 Crystal Reports

Este gerador de relatrio desenvolvido pela empresa norte-americana Business Objects S/A e est disponvel tanto para ambiente Windows, como para Web. Segundo Visual Dataflex (2004) o Crystal Reports inclui mais de 30 drivers de acesso a diversos SGBDs. Conforme Visual Dataflex (2004) o Crystal Reports possui ferramentas para analisar tendncias, mostrar relacionamentos ou focalizar fatos. Algumas funcionalidades: Analyser: permite zoom interativo, drill down e modificao de grficos e mapas; Cross-tabs que permitem comparaes de dados; Editor de frmulas: poderosa ferramenta para criao de dados, com mais de 160 funes diferentes. Constata-se que um dos pontos fracos o alto custo da ferramenta e a necessidade de se adquirir um drive de acesso ao banco de dados dataflex. 5.2 INTERFACE DO PROTTIPO

A Figura 17 abaixo demonstra o Diagrama de Fluxo de Dados (DFD) do prottipo.

66

Figura 17:Diagrama de Fluxo de Dados (DFD)

As etapas seguintes demonstram o prottipo e sua operacionalizao.

67

5.2.1 Acesso ao Prottipo

A Figura 18 demonstra a tela de acesso ao prottipo onde deve ser informado usurio e senha.

Figura 18: Formulrio de acesso ao sistema, verificao de usurio e senha

Aps a validao de usurio e senha o sistema apresentar o menu como demonstrado na Figura 19. Neste menu esto disponveis as opes para Definio do Ambiente, Carga de Dados, Visualizar Dados, Minerar Dados, Sair (do Prottipo) e Sobre (dados sobre o prottipo como autor, nome, ano, etc).

Figura 19: Menu principal do Prottipo

68

5.2.2 Definindo o Ambiente

A opo Definindo o Ambiente consiste na criao do ambiente de Data Warehouse ou Data Mart. nesta tela que os usurios do prottipo geram sua estrutura de dados, atravs da definio de tabelas e seus atributos, relacionamento com outras tabelas, gerando desta forma um modelo estrela ou floco de neve. A Figura 20 apresenta a tela onde o usurio gera uma tabela, definindo o nome e um tipo para a tabela (fato ou dimenso), o cdigo gerado automticamente pelo prottipo.

Figura 20: Criando a Tabela de Dados

69

A Figura 21 demonstra a criao de atributos, que iro compor a tabela. Cada atributo dever receber um nome, um tipo de dado (numrico, caracter, inteiro ou data), alm do tamanho e preciso.

Figura 21: Definindo os atributos da tabela

70

A Figura 22 apresenta a tela onde podem ser estabelecidas regras que sero aplicadas aos dados aps a importao, durante o processo de limpeza e transformao. Este procedimento visa garantir a formatao e integridade dos dados importados, evitando com isso que ocorram inconsistncias na base. O exemplo da Figura apresenta a utilizao de regras para o carregamento de dados para o atributo sexo, quando o valor for M ou 1 ser armazenado no Data Mart a informao MASCULINO.

Figura 22: Definindo regras de transformao de dados

71

A Figura 23 demonstra como utilizar o relacionamento entre atributos de duas tabelas diferentes. O exemplo utilizado consiste em criar um atributo cidade na tabela paciente e relacionar com atributo identificador na tabela cidade para buscar dados como nome da cidade e Estado.

Figura 23: Definindo relacionamento de atributos entre tabelas

72

Em levantamento de dados realizado no HRO foram definidas as seguintes tabelas para validao do prottipo. A Figura 24 demonstra o modelo estrela gerado para validar a ferramenta em desenvolvimento.

Figura 24: Modelo de dados gerado para demonstrao do prottipo

73

A Figura 25 exibe uma opo disponvel no prottipo para exportar dados (extrao) de bases dataflex, gerando um arquivo texto, podendo esta opo ser executada selecionando todos os atributos da tabela, ou somente os considerados imprescindveis para o processo de tomada de deciso.

Figura 25: Extrao de dados de uma tabela para um arquivo texto

74

A Figura 26 se refere a tela de importao de dados que esto disponveis atravs de arquivos texto. Os usurio pode definir o layout de importao no momento da execuo do programa, seguindo a estrutura da tabela na ntegra ou vinculando itens do arquivo texto com determinados atributos da tabela. Os dados importados ficam armazenados em uma tabela temporria para posterior transformao e limpeza, somente aps este processo ser possvel a carga dos dados para o data warehouse.

Figura 26: Importao dos dados de um arquivo texto para uma tabela

75

A Figura 27 apresenta a tela do prottipo onde os dados passam por um processo de tratamento das informaes (limpeza e transformao), nesta etapa os dados permanecem em tabelas temporrias para posterior carga. Neste momento o sistema aplicar as regras definidas como exemplificados no caso do sexo MASCULINO.

Figura 27: Transformao dos dados importados

76

A Figura 28 demonstra a opo onde possvel realizar a carga definitiva dos dados armazenados em tabelas temporrias para o Data Warehouse, disponibilizando os dados para o processo de minerao e visualizao.

Figura 28: Carga dos dados transformados

77

A Figura 29 demonstra a opo do prottipo para inserir dados que tem relevncia mas que no so tratados pelos sistemas OLTPs. No caso da oncologia do HRO foi verificado que a ficha de avaliao nutricional que possui dados importantes sobre hbitos e costumes dos pacientes preenchida manualmente, e por este motivo foi desenvolvida uma opo para o carregamento direto no Data Warehouse.

Figura 29: Lanamento de dados diretamente no prottipo

78

5.2.3 Visualizar Dados

Este mdulo do prottipo utiliza basicamente a tcnica de visualizao que faz parte das tcnicas de Data Mining e OLAP. A Figura 30 demonstra a consulta dos dados que foram importados. Neste programa o usurio pode selecionar a tabela e automaticamente sero listados os registros carregados.

Figura 30: Consulta de dados por tabela

79

A Figura 31 demonstra uma opo onde o usurio pode selecionar o atributo, tipo de grfico, titulo para o grfico, opo para exibio de legenda, valores e configurao do tipo e tamanho de fontes.

Figura 31: Gerador de grficos

80

A Figura 32 exibe o grfico gerado conforme parmetros estabecidos pelo usurio. No exemplo foi gerado um grfico de pizza, exibindo os atendimentos por diagnsticos topogrficos (que identificam o local principal da manifestao do tumor).

Figura 32: Exemplo de grfico definido pelo usurio

81

A Figura 33 apresenta a opo que permite que atravs do prottipo se execute relatrios criados pelos prprios usurios ou desenvolvedores na ferramenta Crystal Reports. No exemplo foi utilizado um relatrio (drilldown.exe) que apresenta o grfico de atendimentos por sexo, onde ao executar um duplo clique com o mouse na rea do grfico exibida a relao de atendimentos que compem est regio do grfico.

Figura 33: Execuo de relatrio externo gerados no Crystal Report

82

A Figura 34 exibe o grfico de atendimentos por sexo.

Figura 34: Exemplo relatrio externo gerado no Crystal Report (drilldown.exe)

83

A Figura 35 exibe os atendimentos que compem a rea do grfico, apresentando os pacientes do sexo feminino.

Figura 35: Dados dos pacientes femininos atendidos

84

5.2.4 Minerar Dados

Foram utilizadas neste mdulo, tcnicas de clusterizao, rvore de deciso e induo de regras. A Figura 36 apresenta um formulrio que permite ao usurio definir filtros que delimitem o universo de dados que se pretende avaliar, este procedimento pode restringir a minerao a um determinado periodo ou caracteristica. Esta opo tem como funo otimizar o processo de leitura levando em considerao a utilizao de banco dataflex.

Figura 36: Seleo de Dados para Aplicao de Tcnicas de Minerao

85

O prottipo apresenta opo de o usurio gerar uma rvore de deciso, atravs da aplicao de regras que podem ser definidas interativamente. A Figura 37 mostra um exemplo da utilizao da rvore de deciso. No exemplo demonstrado primeiramente foi aplicada uma regra para tratar os dados de pacientes de cor branca, onde o prottipo gerou um novo nvel com duas sub-divises (COR igual a BRANCO e COR diferente de BRANCO) que so apresentadas em forma de folha. Aps foi aplicada na sub-diviso (COR igual a BRANCO) uma nova regra para filtrar pacientes da religio catlica, onde gerou uma nova sub-diviso (RELIGIO igual a CATOLICA e RELIGIO diferente de CATOLICA). Na mesma tela pode ser visualizado os percentuais relativos as sub-divises, sendo que o primeiro % sobre (RELIGIO igual a CATOLICA) em relao ao total geral e o segundo % (RELIGIO igual a CATOLICA) em relao a sub-diviso (COR igual a BRANCO).

Figura 37: rvore de deciso

86

Na Figura 38 so visualizados os registros dos atendimentos que compem a subdiviso selecionada, no exemplo so exibidos os pacientes de cor branca e da religio catlica. Conforme observado na Figura os nomes dos pacientes e dos profissionais mdicos esto criptografados por questes ticas.

Figura 38: Atendimentos que compem a sub-diviso selecionada

87

Na Figura 39 exibe o grfico comparativo gerado na rvore a partir da regra aplicada pelo usurio. O grfico exibe o percentual e quantidade de atendimentos da religio catlica em relao a outras religies.

Figura 39: Grfico comparativo referente a atendimentos por religio

88

Na Figura 40 aplicada tcnica de minerao denominada clusterizao que consiste em gerar agrupamentos de atendimentos similares, onde o usurio pode selecionar os atributos a serem avaliados, neste caso a cor da pele, religio do paciente e procedimento utilizado no tratamento, o resultado demonstrado atravs de clusters totalizados com a quantidade e percentual de atendimentos. Alm disso pode-se verificar que para cada cluster gerado um identificador que permite verificar quais atendimentos fazem parte do mesmo.

Figura 40: Gera clusters

Na tabela da Figura acima verifica-se uma coluna com a opo << Ver >>, que ao evento de um duplo clique do usurio ativada uma tela com todos os atendimentos que compem este cluster, conforme Figura 41.

89

possvel observar na Figura 41 todos os dados relativos ao atendimento que foram definidos na tabela de fatos.

Figura 41: Visualiza atendimentos que fazem parte do cluster selecionado

90

5.2.5 Sobre Informaes sobre o Prottipo

Na Figura 42 so exibidos os dados relativos ao acadmico, orientador, titulo do trabalho, universidade, curso e informaes do sistema relativas a hardware.

Figura 42: Informaes sobre o prottipo

5.3

CONSIDERAES FINAIS DO CAPTULO

O objetivo deste captulo foi demonstrar como foi desenvolvido o prottipo, as ferramentas utilizadas, a interface e aplicao na rea oncolgica. importante ressaltar que, partindo-se de um modelo de dados utlizando atributos mais significativos os resultados obtidos tero maior relevncia.

91

CONSIDERAES FINAIS

Durante o desenvolvimento deste Trabalho de Concluso de Curso (TCC) diversas etapas foram realizadas, dentre elas: compreender a oncologia, conhecer as tecnologias como Data Warehouse, Data Mining e OLAP. Atravs do trabalho foi possvel conhecer as fases necessrias para construo de uma ferramenta que possibilitasse desde a definio de um ambiente Data Warehouse at a aplicao de Data Mining e OLAP. Durante o processo de construo da ferramenta a rea oncolgica foi utilizada como referncia para validao do prottipo. Com a realizao destas etapas todos os objetivos estabelecidos foram alcanados. Este trabalho demonstrou que projetar uma ferramenta que permita flexibilidade e ao mesmo tempo contemple aspiraes de usurios que geralmente so complexas, exige-se domnio e conhecimento de tecnologias e principalmente tcnicas de engenharia de software. Com a concluso do trabalho fica claro que para obter conhecimento utilizando-se este prottipo primordial o conhecimento do fluxo de trabalho da rea de atuao. No caso especfico do Hospital Regional do Oeste, esta ferramenta pode contribuir para novas descobertas que contribuam para preveno e aprimoramento do tratamento do paciente.

6.1

RESUMO DAS CONTRIBUIES

Este trabalho trouxe como contribuio a obteno de conceitos, conhecimento de novas tecnologias atravs da reviso bibliogrfica, a construo do prottipo contribuiu para aplicao prtica dos conceitos e conhecimentos adquiridos. necessrio destacar que o trabalho enfocou uma rea dentro do contexto da sade, o que muito relevante devido importncia que tem a vida das pessoas.

92

6.2

TRABALHOS FUTUROS

O desenvolvimento e validao desta ferramenta no se encerram por aqui, abaixo apresento algumas sugestes para trabalhos futuros visando ampliar a capacidade e validao do prottipo em pauta: Aplicao de outras tcnicas de Data Mining como Inteligncia Artificial, Associao, Algoritmos Genticos; Utilizao deste prottipo por profissionais ou acadmicos da rea de sade para validar a funcionalidade e eficincia da ferramenta, apresentando limitaes e sugestes para melhoria.

93

REFERNCIAS

ALCANTARA, Alexandre de. Business Intelligence - Produzindo Resultados, Obtido via internet. Ultimo acesso: 15/05/2005. http://www.datamodelling.com.br/html/art20030528.htm ANDREATTO, Ricardo. Construindo um Data Warehouse e analisando suas informaes com Data Mining e OLAP. Obtida via internet. Ultimo acesso: 29/04/2005 http://www.datawarehouses.hpg.ig.com.br/ BAPTISTA, Evaristo. Um Modelo para Anlise Gerencial na rea de Vendas. Dissertao (Mestrado em Engenharia de Produo) Universidade Federal de Santa Catarina, Florianpolis, 2001. BIGOLIN, Nara Martini. Data Mining: Conceitos e Tcnicas. VII Escola de Informtica da SBC Sul, 2000. BISPO, Carlos Alberto; CAZARINI, Edson. Transformando Dados em Informaes via Data Mining. Developers Magazine, Rio de Janeiro, 1999.

BRACKETT, Michael H. The Data Warehouse Challenge, Wiley Computer Publishing,


1996. CAMPOS e FILHO, Maria Luiza & FILHO, Arnaldo V. Rocha. Data warehouse. Obtida via Internet. Ultimo acesso: 01/05/2005. http://genesis.nce.ufrj.br/dataware/tutorial/indice.html. CARVALHO, Luis Alfredo Vidal de. Data Mining: a minerao dos dados no marketing, medicina, economia, engenharia e administrao. So Paulo: rica, 2001 CENAFERT, Centro e Endoscopia e Assistncia Fertilidade. Oncologia. Obtida via internet. Ultimo acesso: 19/02/2005. www.cenafert.com.br/oncologia.htm

CHAUDHURI, S. e DAYAL, U. An Overview of Data Warehousing and Olap Tecnology, SIGMOD Record, New York, v.26, n 1, Mar/1997.
DALALBA, Adriano. Um estudo sobre Data warehouse. Obtida via internet. Ultimo acesso: 01/05/2005. http://www.geocities.com/siliconvalley/port/5072/. DALFOVO,Oscar & GRIPA, Robson. Data warehouse: usando a tcnica de cubo de deciso. Developers Magazine, So Paulo, n.32, p.12-17, abr de 1999. DATA WAREHOUSE, 1999. Obtida via internet. Ultimo acesso: 09/03/2005

94

http://www.datawarehouse.inf.br/ DE TONI, Alexandre. Definio de um Data Mart em Cooperativas Agropecurias. Engenharia da Produo e Sistemas de Mestrado Mdia e Conhecimento, UFSC: Florianpolis, 2000. Obtida atravs da internet. Ultimo acesso: 20/05/2005.

www.stefa.ufsc.br/defesa/pdf/4034.pdf DI DOMENICO, Jorge Antonio. Definio de um ambiente Data Warehouse em uma Instituio de Ensino Superior. Programa de Ps-Graduao em Engenharia da Produo, UFSC, Florianpolis, 2001. Obtida via Internet. Ultimo acesso: 20/05/2005.

www.teses.eps.ufsc.br/resumo DWB Brasil. Data Mining 2000, Obtida via Internet. Ultimo acesso: 01/05/2005. www.dwbrasil.com.br/html/dmining.html FURLAN, Jos Davi. et. Al. Sistemas de Informao Executiva EIS. Makron Books, So Paulo, 1994. GIMENES, Eduardo. Monografia sobre Data Mining, 2000. Obtida via internet. Ultimo acesso: 25/05/2005. http://br.geocities.com/dugimenes/index.htm INCA, Instituto Nacional do Cncer. rgo responsvel pelo Controle do Cncer no Brasil. Obtida via internet. Ultimo acesso: 19/02/2005. http://www.inca.gov.br/ INFOCNCER. Aprenda sobre o Cncer, 2000. Obtida via internet. Ultimo acesso: 20/02/2005. http://www.infocancer.hpg.ig.com.br/cancer.html INMON, William H. Gerenciando Data Warehouse. Makron Books, So Paulo, 1999. INMON, William H. Como Construir o Data Warehouse, Campus, Rio de Janeiro, 1997. KIMBALL, Ralph. Data Warehouse Toolkit. Makron Books, So Paulo, 1998. MV2, Business Inteligence, 2000. Obtida via internet. Ultimo acesso: 01/06/2005. www.mv2.com.br/BI.htm NETO, Manoel Gomes de Mendona. Minerao de Dados. VI Escola Regional de Informtica de So Paulo, SBC. PEREIRA,Max Roberto. Data warehouse: otimizando seu desempenho.Developers Magazine, So Paulo, n.32, p.22-26, abr de 1999.

95

PINHEIRO, Carlos Andr Reis. Data mining: obtendo vantagens com seu data warehouse. Developers Magazine, So Paulo, n.35, p.38-40, jul de 1999. RODRIGUES, Anderson. Desenvolvendo em Visual Dataflex 6. 2 ed. So Paulo: Copyright, 1999. SASSE, Andr. E-Cancer Informaes em Cncer e Oncologia. Obtida via internet. Ultimo acesso: 19/02/2005. http://andre.sasse.com/oncologia SMANIOTTO, Ana Karla. Um estudo sobre Data Mining aplicado rea Acadmica na UNOESC CHAPECO. Monografia (Curso de Cincia da Computao) UNOESC, Chapec, 2001. SONSA, Aline. Prottipo de Data Mining aplicado ao processo da gesto do conhecimento na UNOCHAPECO. Monografia (Curso de Cincia da Computao) UNOCHAPECO, Chapec, 2002. SOUZA, Roberto Carlos de. Tecnologias da Informao. Xadrezeduca. Obtida via internet. Ultimo acesso: 15/04/2005. www.xadrezeduca.com.br/site/a5/artigo4.shtml VISUAL DATAFLEX. Maio de 2004. Disponvel em: <http://www.dataacess.com.br/visual dataflex.asp> Acesso em: 05 out. 2005.

You might also like