You are on page 1of 14

Gest. Prod., So Carlos, v. 17, n. 4, p.

721-734, 2010

Tcnicas de minerao visual de dados aplicadas


aos dados de instrumentao da barragem de Itaipu

Visual data mining techniques applied for the analysis


of data collected at Itaipu power plant

Marco Aurlio Silva Neto3


Rosangela Villwock4
Srgio Scheer1
Maria Teresinha Arns Steiner2
Andra Sell Dyminski1

Resumo: A usina de Itaipu, maior geradora de hidroeletricidade do mundo, possui mais de 2.200 instrumentos
que monitoram seu comportamento geotcnico e estrutural, os quais possuem leituras armazenadas em um banco
de dados h mais de 30 anos. A alta dimensionalidade e a grande quantidade de registros contidos nas bases de
dados so problemas no triviais tendo-se em vista a busca pelo conhecimento a partir desses dados. Neste artigo
apresentado um estudo no qual foram utilizados algoritmos de Minerao Visual de Dados (MVD), integrando
tcnicas de Minerao de Dados (MD) com tcnicas de Visualizao de Informao (VI), para analisar estes dados de
instrumentao, tendo como objetivo estabelecer relaes existentes entre diferentes instrumentos, que possibilitem
detectar falhas indesejveis no sistema de monitoramento e possveis danos segurana e integridade da barragem.
Um maior nmero de informaes pde ser extrado mais facilmente quando diferentes tcnicas de VI, juntamente
com as de MD, so aplicadas aos dados. A anlise visual dos dados mostrou-se eficiente por agilizar a deteco de
anomalias nos dados, sendo uma valiosa ferramenta de apoio tomada de decises.
Palavras-chave: Processo KDD. Visualizao de informaes. Minerao de dados. Minerao visual de dados.
Monitoramento de barragens.

Abstract: Itaipu, the greatest hydroelectric power plant in operation in the world, has more than 2,200 monitoring
instruments, which have been storing readings in databases for more than 30 years. The large data sets of high
dimensionality and the large amount of records inserted into databases are non-trivial problems when conducting
a search for knowledge through the data. This paper introduces a study using Visual Data Mining (VDM)
algorithms integrating Data Mining (DM) techniques with Visualization of Information (VI) techniques to analyze
the data collected at Itaipu dam. The main objective was to establish relationships between the variables in order
to detect undesirable failures that can compromise the security and integrity of the dam. More information may be
more easily extracted when different techniques of Visualization of Information, together with techniques of Data
Mining, are applied for data analysis. The visual analysis of the data has proved efficient in detecting patterns of
anomalies, and thus it can be considered a valuable tool to support decision making.
Keywords: KDD process. Information visualization. Data mining. Visual data mining. Dam monitoring.

1 Introduo
Uma vez que os potenciais prejuzos e riscos construo adequada e a correta operao de barragens
decorrentes de acidentes em barragens podem so preocupaes de mbito mundial. Alm disso,
assumir grandes dimenses, um projeto seguro, uma um efetivo monitoramento em grandes barragens

1
Departamento de Construo Civil, Programa de Ps-Graduao em Mtodos Numricos em Engenharia PPGMNE,
Universidade Federal do Paran UFPR, CP 19081, CEP 81531-990, Curitiba PR
2
Coordenao da Engenharia de Produo, Programa de Ps-Graduao em Mtodos Numricos em Engenharia PPGMNE,
Universidade Federal do Paran UFPR, CP 19081, CEP 81531-990, Curitiba PR
3
Instituto Tecnolgico SIMEPAR, Centro Politcnico da UFPR, Programa de Ps-Graduao em Mtodos Numricos em Engenharia
PPGMNE, Universidade Federal do Paran UFPR, Jardim das Amricas, CP 19100, CEP 81531-980, Curitiba PR
4
Programa de Ps-Graduao em Mtodos Numricos em Engenharia PPGMNE, Universidade Federal do Paran UFPR,
Universidade Estadual do Oeste do Paran UNIOESTE, Campus Francisco Beltro, Rua Maring, 1200, Vila Nova,
CEP 85605-010, Francisco Beltro PR
Recebido em 25/5/2009 Aceito em 7/8/2010
Suporte financeiro: CAPES, CNPq e PICDT/CAPES/UNIOESTE.
722 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010

imprescindvel para a segurana da estrutura. da metodologia adotada; na seo 5, so mostrados


Diretrizes internacionais visando a segurana de e analisados os resultados, seguidos das concluses,
barragens e muitas discusses produtivas sobre este na seo 6.
tema tm sido propostas e conduzidas, tais como a
da Comisso Internacional de Grandes Barragens 2 A barragem de Itaipu e
(ICOLD International Comission on Large Dams)
(INTERNATIONAL..., 2008). No Brasil, diretrizes
obteno dos dados
visando segurana de barragens foram publicadas Nesta seo feita uma apresentao sucinta da
pelo Comit Brasileiro de Grandes Barragens em Itaipu Binacional, maior hidreltrica em produo de
1983 (COMIT..., 1983) e um projeto de lei sobre energia do mundo, enfatizando a sua instrumentao
assunto tramita pelo congresso nacional desde 2003 e, na sequncia, so apresentados os dados sobre os
(BRASIL, 2009). instrumentos utilizados no presente estudo.
O monitoramento da estrutura de uma barragem, A Itaipu Binacional teve o incio da sua construo
de importncia bem conhecida, pode gerar uma em 1973 em um trecho do Rio Paran conhecido por
enorme massa de dados, definidos em domnios Itaipu que, em tupi, quer dizer a pedra que canta,
multidimensionais, cuja anlise e interpretao nem localizado no corao da Amrica do Sul na divisa
sempre so triviais. A anlise minuciosa dos dados entre o Paraguai e o Brasil (ITAIPU, 2008). Em 1982,
dos instrumentos de auscultao exige a combinao chegaram ao fim as obras da barragem, sendo a ltima
de conhecimentos de engenharia com matemtica e unidade geradora inaugurada em 2008.
estatstica, bem como experincia prvia do engenheiro Atualmente, a barragem de Itaipu possui 20 unidades
ou tcnico responsvel pela interpretao destes dados, geradoras de 700 MW (megawatts) cada, gerando uma
consumindo muito tempo e muitas vezes inviabilizando potncia total instalada de 14.000 MW. No ano 2000,
o cumprimento rpido desta tarefa. Por esta razo, o a Itaipu Binacional bateu seu recorde em gerao de
uso de tcnicas e ferramentas computacionais, que energia, cerca de 93,4 bilhes de quilowatts-hora
auxiliem o tomador de decises, relevante. (KWh). responsvel pelo abastecimento de 95%
O objetivo do presente artigo analisar a integrao da energia eltrica consumida no Paraguai e 24% de
de tcnicas de Minerao de Dados (MD) com tcnicas toda a demanda do mercado brasileiro.
de Visualizao de Informaes (VI) utilizando dados A barragem de Itaipu possui 7.919 m de extenso e
reais obtidos de instrumentos de monitoramento da altura mxima de 196 m, dimenses que transformaram
barragem de Itaipu. O resultado da integrao destas esta obra em referncia nos estudos de concreto e na
tcnicas conhecida na literatura por Minerao Visual segurana de barragens. composta por dois trechos
de Dados (MVD) (WONG, 1999). O uso de tcnicas de barragens de terra, um trecho de barragem de
e ferramentas para a MVD permite ao analista extrair enrocamento e trechos de concreto, compondo as
informaes existentes e escondidas nos dados, estruturas mais altas do conjunto. A Figura 1, a seguir,
alm de identificar grupos, anomalias e correlaes mostra um esboo da estrutura geral da barragem e
de padres, de forma visual, rpida e efetiva. a Tabela 1 apresenta as principais caractersticas dos
Num grande volume de dados, frequentemente h trechos da barragem apontados na Figura 1.
informao escondida e que no est prontamente Em toda sua extenso, para acompanhar o desem-
evidente. Segundo Tan et al. (2005), analistas humanos penho das estruturas de concreto e fundao, so
podem levar semanas para descobrir este conhecimento encontrados 2.218 instrumentos (1.362 no concreto
e muitos dados nunca so analisados. Enquanto e 856 nas fundaes e aterros) sendo que destes, 270
aumenta a quantidade de dados, aumenta a aplicao esto automatizados; alm disso, existem 5.239 drenos
de tcnicas de MVD. Para Witten e Frank (2000), (949 no concreto e 4.290 nas fundaes). Todas estas
dados inteligentemente analisados so um valioso leituras ocorrem em diferentes frequncias, podendo
recurso para tomada de decises. ser, por exemplo, diria, semanal, quinzenal, mensal,
Este artigo est organizado da seguinte forma: na dependendo do tipo de instrumento.
seo 2, so apresentadas as principais informaes Embora os nove trechos da barragem de Itaipu
sobre a barragem de Itaipu e sobre os extensmetros, sejam instrumentados e monitorados, um trecho da
instrumentos cuja base de dados foi aqui analisada. Barragem Principal (trecho F) merece destaque e um
Na seo 3, aborda-se a questo da extrao de estudo mais aprofundado. No trecho F encontram-se
conhecimento a partir de bases de dados, ou seja, as turbinas para a gerao da energia eltrica, alm
sobre o processo KDD (Knowledge Discovery in de ser o trecho de maior altura em coluna de gua
Databases ou Descoberta de Conhecimento em Bases e o mais instrumentado. Este trecho constitudo
de Dados) e apresentada uma introduo ao tema de vrios blocos, sendo que cada um deles possui
de agrupamento de dados (padres ou instrumentos instrumentos que fornecem dados a respeito de seu
no problema aqui apresentado), forma utilizada para comportamento fsico, tanto na estrutura de concreto
o tratamento. Na seo 4, encontra-se o detalhamento como na sua fundao.
Tcnicas de minerao visual de dados aplicadas aos dados de instrumentao da barragem de Itaipu 723

Por estes motivos, optou-se por estudar o trecho Figura 1, esto localizados 30 extensmetros, cada
F de Itaipu, no qual se encontram 30 extensmetros, um com uma, duas ou trs hastes totalizando, assim,
74 piezmetros, 11 medidores triortogonais, 4 72 medidas de deslocamento. Como estas 72 medidas
medidores de nvel de gua e 9 medidores de vazo so independentes, sero aqui denominadas de hastes
(SILVA NETO, 2008). Destes, foram selecionados de extensmetros. Estas medidas so aqui identificadas
para anlise os extensmetros, que so do tipo da seguinte forma: equip4_1, que significa haste 1
mltiplo de hastes, instalados em furos de sondagem. do extensmetro 4 e assim por diante.
Este tipo de instrumento considerado um dos mais
Os registros histricos das hastes de extensmetros,
importantes para o monitoramento da barragem,
contidos no banco de dados da empresa, contm dados
pois so responsveis pelas medies de recalques
mensais, datados de janeiro/1995 a dezembro/2004,
de uma barragem de concreto. Estes recalques, ou
deslocamentos verticais, consistem em uma das totalizando 120 leituras. O perodo foi assim deter-
observaes mais importantes na superviso do minado por sugesto da equipe de engenheiros da
comportamento da estrutura durante os perodos de Itaipu, pois posterior construo da hidreltrica
construo, enchimento do reservatrio e operao e anterior implantao do sistema de aquisio
da barragem. Segundo Silveira (2003), nos blocos automtica de dados. Vale salientar que, durante a
onde h galerias de acesso transversais ao eixo, a fase de instalao deste sistema, alguns instrumentos
instalao de extensmetro a montante e a jusante ficaram sem leituras manuais e que, alm disso, as
permite medir deslocamentos angulares da barragem 24 hastes de extensmetros j automatizadas sofreram
junto fundao. modificaes que podem ter influenciado as leituras
Tambm se utilizam extensmetros para medir posteriores. Desta forma, as referidas 120 leituras
deslocamentos verticais do macio rochoso basltico, mensais referentes s 72 hastes de extensmetros
onde a fundao da barragem tem sua base. So ficaram isentas destas irregularidades.
importantes no monitoramento de uma barragem, Estes 120 registros histricos foram analisados
sendo dada especial ateno a descontinuidades no segundo o processo KDD, descrito em linhas gerais
macio rochoso, tais como juntas, falhas e contatos
na seo 3, a seguir, particularizado para o problema
entre rochas. Cada extensmetro instalado em
aqui descrito, na seo 4.
um local especfico e pode ser composto por vrias
hastes de comprimentos diferentes. Assim, possvel
controlar separadamente o deslocamento vertical de
cada descontinuidade geolgica, conforme se pode
observar na Figura 2.
Vale salientar que o estudo aqui desenvolvido
a respeito dos extensmetros pode ser facilmente
estendido de forma similar aos demais instrumentos.

2.1 Coleta de dados


Os dados com os quais o presente trabalho foi
desenvolvido referem-se, conforme j mencionado, aos
instrumentos de monitoramento da barragem de Itaipu,
mais especificamente, aos extensmetros instalados Figura 1. Um esboo da estrutura geral do complexo de
no trecho F da barragem. Neste trecho F, esboado na Itaipu (ITAIPU, 2008).

Tabela 1. Caractersticas dos trechos da Barragem de Itaipu com destaque ao trecho F analisado neste estudo.
Trecho Estrutura Comprimento (m) Altura mxima (m)
1 L-Barragem Auxiliar Terra 2294 30
2 K-Barragem Auxiliar Enrocamento 1984 70
3e7 E, I e D-Barragens Laterais Contraforte 1438 81
4 H-Estrutura de Desvio Concreto Macio 170 162
5 F-Barragem Principal Gravidade Aliviada 612 196
9 Q-Barragem Auxiliar Terra 872 25
Outros Trechos Caractersticas
8 A-Vertedouro 350 m de largura
6 U-Casa de Fora 20 Unidades Geradoras
724 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010

Esquema geral de instalao Detalhes dos componentes Perfil tpico de instalao


Relgio comparador

Cabea de leitura
5

Concreto
4

Basalto vesicular
Tubo de proteo PVC 3/4''

1 - barra de ancoragem Descontinuidade Haste de ferro galvanizado


2 - cone de ancoragem deformvel
3 - haste c/ tubo de proteo
4 - cabea de leitura
5 - apoio p/ o relgio
comparador
3 Furo de sondagem

Basalto denso

Material solto
Areia ou cascalho fino
2
Argamassa de ancoragem
Brecha

1 Cascalho

Descontinuidade
deformvel

Basalto denso Sistema de ancoragem

Calda de cimento
0,5/1 (peso)

Figura 2. Ilustrao de um extensmetro mltiplo de haste (MATOS, 2002), instrumento utilizado para o desenvolvimento
do presente estudo.

3 O processo Descoberta de Formatao, Minerao de Dados e Interpretao,


Conhecimento em Bases conforme ilustrado na Figura 3.
de Dados KDD O processo inicia-se com o entendimento do
domnio da aplicao e dos objetivos a serem
O processo KDD definido por Fayyad et al. atingidos. Ento uma seleo poder ser realizada
(1996) como um processo no trivial de descoberta de
nestes dados a fim de se trabalhar com os dados de
padres vlidos, novos, teis e acessveis. A principal
interesse. A etapa de pr-processamento responsvel
vantagem do processo de descoberta que no so
pela anlise e tratamento de dados faltantes ou
necessrias hipteses, sendo que o conhecimento
inconsistentes. Na etapa de formatao, h uma
extrado dos dados sem conhecimento prvio.
KDD refere-se ao amplo processo de descoberta de preparao dos dados visando a aplicao da MD
informaes em banco de dados, no qual se enfatiza a como, por exemplo, transformando dados categricos
aplicao de alto nvel dos mtodos de MD. Enquanto em valores numricos ou, ento, usando mtodos de
a etapa de MD se destaca pela extrao de padres reduo de dimensionalidade nos dados. As etapas
escondidos nos dados, o processo completo KDD de pr-processamento e formatao, segundo Silver
mais amplo e abrange vrias etapas necessrias para (1996), podem levar at 80% do tempo necessrio
que isso ocorra, tornando possvel, aps tcnicas de para todo o processo.
MD, avaliar e interpretar os resultados obtidos. Prosseguindo no processo, chega-se etapa de
O processo KDD um conjunto de atividades MD, principal etapa do processo KDD, na qual
contnuas composto, basicamente, por cinco etapas: diversos mtodos podem ser usados para extrao de
Seleo dos Dados, Pr-Processamento e Limpeza, informaes, as quais, por sua vez, so apresentadas na
Tcnicas de minerao visual de dados aplicadas aos dados de instrumentao da barragem de Itaipu 725

Figura 3. Etapas do processo KDD (FAYYAD et al., 1996).

ltima etapa, a interpretao, em que o conhecimento 3.1 Agrupamento de padres


adquirido. Se o resultado final no for satisfatrio, todo Fayyad et al. (1996) mostram que as tarefas de
o processo pode ser realimentado alterando algumas MD podem ser, de uma forma geral, preditivas ou
informaes as quais podem ser reprocessadas nas descritivas. As preditivas usam algumas variveis para
etapas anteriores. prever valores desconhecidos ou futuros de outras
O principal objetivo do processo KDD obter variveis, enquanto que as descritivas encontram
o conhecimento de informaes escondidas nos padres para descrever os dados. As principais
dados que sejam teis nas tomadas de decises, tarefas de MD esto relacionadas Classificao,
utilizando mtodos, algoritmos e tcnicas de diferentes Agrupamento e Associao de padres. Conforme
reas cientficas que, segundo Tan et al. (2005) e j comentado, neste artigo, a tarefa da MD o
Gimenes (2000), incluem aprendizagem de mquina, agrupamento de padres.
reconhecimento de padres, estatstica e matemtica, O Agrupamento ou Segmentao (Clustering)
aquisio de conhecimento para sistemas especialistas procura grupos de padres tais como padres
pertencentes a um mesmo grupo so mais similares
e visualizao de dados.
uns aos outros e dissimilares a padres em outros
J a VI um processo indispensvel na etapa de
grupos. Segundo Hair Jr. et al. (2005), a anlise de
MD, segundo Rezende (2003). Para Keim (1979), agrupamentos uma tcnica analtica para desenvolver
a VI permite ao usurio adquirir percepes sobre subgrupos significativos de objetos. Seu objetivo
os dados, podendo provocar o surgimento de novas classificar os objetos em um pequeno nmero de
hipteses. Este autor acrescenta que quando comparada grupos mutuamente excludentes. Para Freitas (2002),
s tcnicas automticas de MD, como Estatstica na anlise de agrupamento importante favorecer
e Aprendizagem de Mquina, a explorao visual um nmero pequeno de grupos.
dos dados apresenta vantagens excedentes, tais Os algoritmos de agrupamentos podem ser divididos
como: lida mais facilmente com dados altamente em categorias de diversas formas de acordo com
heterogneos e ruidosos, intuitiva, e no requer algumas caractersticas. As duas principais classes
maior entendimento de complexos algoritmos ou de algoritmos de agrupamentos so os mtodos
parmetros da matemtica ou estatstica. Ankerst e hierrquicos, dentre os quais se destaca o Mtodo de
Keim (2001) definem MVD, como sendo um passo Ward (da Anlise Estatstica Multivariada), utilizado
neste estudo e mtodos de particionamento como,
no processo KDD, utilizando a VI como um canal
por exemplo, o mtodo k-mdias.
de comunicao entre o computador e o usurio.
Mtodos hierrquicos englobam tcnicas que
A essncia deste artigo apresentar algumas das buscam hierarquicamente os grupos e, por isso,
tcnicas de MD para o agrupamento de padres admitem obter vrios nveis de agrupamento. Os
(extensmetros) e de VI (melhor visualizao dos mtodos hierrquicos podem ser subdivididos em
resultados), verificando o relacionamento entre os divisivos ou aglomerativos. O mtodo hierrquico
padres de um mesmo grupo, conforme detalhamento aglomerativo considera, a princpio, cada padro
apresentado nas sees a seguir. como um grupo e, iterativamente, agrupa o par de
726 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010

grupos com maior similaridade em um novo grupo at J para a 3. etapa, o agrupamento dos padres (ou
formar um nico grupo contendo todos os padres. hastes de extensmetros), o mtodo utilizado foi o
O mtodo hierrquico divisivo, encontrado em Diniz Mtodo de Ward, um mtodo hierrquico aglomerativo.
e Louzada-Neto (2000), ao contrrio, inicia com um Segundo Johnson e Wichern (1998), o Mtodo de
nico grupo e executa um processo de sucessivas Ward faz a juno de dois grupos baseando-se na
subdivises. perda de informao. Considera-se como critrio
Outra forma de analisar a formao de grupos, de perda de informao a soma do quadrado do
fazendo o relacionamento entre padres, por meio erro (SQE ou SQE Square Quadratic Error). Para
de tcnicas de VI, em que parmetros visuais, como cada grupo i, calcula-se a mdia (ou centroide) do
cores, forma, tamanho, posio so usados para grupo e a soma do quadrado do erro do grupo i
representar caractersticas e propriedades dos dados (SQEi), que a soma do quadrado do erro de cada
(ARTERO, 2005; KEIM, 1996). Outros parmetros padro do grupo em relao mdia. Assim, para k
estudados em Computao Grfica, como tipo de grupos, tem-se SQE1, SQE2, ..., SQEk, em que SQE
material, luminosidade e transparncia, e tcnicas definida pela Equao 1.
interativas, como rotaes e passeios por meio dos
dados, convidam os usurios a explorar e manipular SQE = SQE1 + SQE2 + ... + SQEk (1)
sistemas de informaes grandes e complexos, Para cada par de grupos m e n, primeiramente,
tambm pode ser usado para facilitar a busca do calcula-se a mdia (ou centroide) do grupo formado
conhecimento (SILVA NETO, 2008). (grupo mn). Em seguida, calcula-se a soma do
Com base nestas formas de interao e navegao,
quadrado do erro do grupo mn (SQEmn), segundo a
diversas tcnicas de VI esto sendo desenvolvidas com
Equao 2.
o objetivo de facilitar a interpretao de dados. Silva
Neto (2008) utiliza estas tcnicas baseando-se nas SQE = SQE1 + SQE2 + ...
(2)
caractersticas e natureza dos dados. Um levantamento ... + SQEk SQEm SQEn + SQEmn
das tcnicas existentes mostrando suas vantagens e
desvantagens podem ser encontradas no trabalho Os grupos m e n que apresentarem o menor
deste autor. aumento na SQE, ou seja, tiverem menor perda de
Neste artigo, a tcnica de MD utilizada para o informao, sero unidos. Segundo Hair Jr. et al.
agrupamento de padres foi o Mtodo de Ward. J as (2005), este mtodo tende a obter grupos de mesmo
tcnicas de VI aplicadas aos dados foram Coordenadas tamanho devido a sua minimizao de variao interna.
Paralelas, Matrizes de Disperso, Orientadas a Pixels Uma forma de representar um agrupamento
e baseadas em cones. Estas tcnicas utilizadas, hierrquico por meio de um dendrograma. Um
enquadradas na metodologia aplicada ao problema,
so apresentadas na seo 4 a seguir.

4 Metodologia adotada
O processo KDD, apresentado de forma genrica
na seo 3 e Figura 3, pode ser particularizado para
o problema aqui abordado, por meio da Figura 4 que
compe a metodologia aqui proposta. Tal metodologia
foi aplicada aos dados de instrumentao da barragem
de Itaipu, mais especificamente s 72 hastes de
extensmetros que, por sua vez, geraram 120 registros
histricos, conforme j comentado na seo 2.1
(1 etapa da Figura 4).
Para a maioria das 72 hastes de extensmetros
analisadas, tem-se uma leitura mensal, porm algumas
delas apresentaram mais de uma leitura por ms
sendo que, nestes casos, foi obtida a mdia mensal.
Por outro lado, algumas hastes de extensmetros
apresentaram leituras faltantes e, nestas situaes,
foram realizadas interpolaes por sries temporais
garantindo que todos as 72 hastes tivessem exatamente
120 leituras (2. etapa da Figura 4). Para um melhor
detalhamento a respeito de tcnicas de interpolao
envolvendo Sries Temporais, sugere-se o livro de
Box e Jenkins, (1976). Figura 4. Etapas da metodologia adotada.
Tcnicas de minerao visual de dados aplicadas aos dados de instrumentao da barragem de Itaipu 727

dendrograma representa o agrupamento dos padres extensmetros) e, normalmente, o intervalo de valores


e os nveis de similaridade em que os grupos se de cada atributo mapeado linearmente sobre o eixo
formam. Pode ser quebrado em diferentes nveis, correspondente. Cada item de um dado exibido
que para Jain et al. (1999), faz a subdiviso em como uma linha poligonal que intercepta cada eixo no
diferentes grupos. ponto correspondente ao valor do atributo associado.
A similaridade entre variveis pode ser medida a Esta tcnica permite observar o relacionamento
partir do coeficiente de correlao. Desta forma, este entre as 72 hastes de extensmetros, analisando
coeficiente r, que calculado pela Equao (3), a as linhas entre os eixos. Se acontecerem poucos
seguir, uma medida pertencente ao intervalo [-1, 1] cruzamentos, ento h um bom relacionamento;
que identifica o nvel de correlao entre pares de muitos cruzamentos indicam um relacionamento ruim.
variveis. Quanto mais prximo dos extremos, -1 Por outro lado, Matrizes de Disperso (ScatterPlots
ou 1, maior a relao entre os dados. Quando Matrices) buscam comparar diversos atributos
os dados so prximos de -1, as variveis so simultaneamente (dois a dois) mapeando os dados
inversamente correlacionveis, ou seja, os valores para um espao bidimensional. Informaes como
crescentes de uma das variveis estaro associados
correlaes e disperses dos dados podem ser extradas
aos valores decrescentes da outra, e quando este
neste tipo de visualizao, contribuindo para um
coeficiente prximo de 1, estas variveis possuem
maior entendimento dos dados, alm de apoiar
comportamentos prximos. Coeficientes prximos de
no procedimento de reduo de dimensionalidade
zero sugerem que as variveis no possuem relao
(KACHIGAN, 1986). Assim, tem-se: (WARD, 1994).
Outras tcnicas como as Orientadas a Pixel,
(xi x)(yi y) encontradas em Keim e Kriegel (1996); Faces de
r= , 1 i n (3)
(n 1)S x S y Chernoff, introduzida por Chernoff (1973); ou Star
Glyphs, em Pickett e Grinstein (1998), geram imagens
em que x representa a mdia do conjunto de valores para cada uma das 72 hastes de extensmetros.
de x e definido pela Equao (4); y representa a O relacionamento entre estas variveis pode ser
mdia do conjunto de valores de y e definido pela observado visualmente, pela semelhana entre
Equao (5); (xi x ) representa o desvio entre xi e a elas, ou seja, imagens parecidas indicam um bom
mdia do conjunto x; (yi y) representa o desvio entre relacionamento entre as variveis.
yi e a mdia do conjunto y ; Sx representa o desvio
padro do conjunto x e definido pela Equao (6)
e Sy representa o desvio padro do conjunto y e 4.1 Minerao Visual de Dados MVD:
definido pela Equao (7). integrao entre Minerao
de Dados MD e Visualizao
1 n de Informaes VI
x= x (4)
n j=1 i
Tcnicas de minerao podem apoiar a explorao
1 n visual de grandes conjuntos de dados, e tambm serem
y= yi
n j=1
(5) apoiadas por recursos visuais. Percebe-se que os dois
problemas crticos em MD tambm so crticos na VI.
(xi x)2 O primeiro a alta dimensionalidade e o segundo
Sx = (6) a grande quantidade de registros contidos nas bases
(n 1 )
de dados atuais, demandando o uso de algoritmos
cada vez mais eficientes.
(yi y)2
Sy = (7) A integrao de tcnicas de MD com tcnicas de
(n 1 )
VI facilita a anlise dos dados tornando-se um valioso
Para definir o relacionamento entre os padres, recurso na tomada de decises, de forma que estas
podem ser aplicadas, tambm, aos grupos anterior- podem ser usadas para auxiliar ou serem auxiliadas
mente definidos, tcnicas de Visualizao de pelas tcnicas de MD.Neste estudo, em particular,
Informaes como, por exemplo: Coordenadas os resultados da tcnica de MD (Mtodo de Ward)
Paralelas, Matrizes de Disperso, Faces de Chernoff, que agrupou os padres (hastes de extensmetros)
Star Glyphs e Orientada a Pixel (4 etapa da Figura 4). permitiu a aplicao das tcnicas de VI (Coordenadas
Artero (2005) define Coordenadas Paralelas Polares; Matiz de Disperso; Orientada a Pixel; Faces
como um espao de dimenso n mapeado para um de Chernoff e Star Glyphs) que foram aplicadas,
espao bidimensional, usando n eixos equidistantes ento, a cada um dos grupos separadamente. Vale
e paralelos a um dos eixos principais. Cada eixo salientar que, em geral, as tcnicas de VI s podem
representa um atributo (neste caso, as 72 hastes dos ser aplicadas a um nmero pequeno de registros.
728 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010

5 Obteno dos resultados corte 2 da Figura 5), a sua inclinao a Montante


Fazendo a implementao das tcnicas descritas (M) ou a Jusante (J), o afastamento em relao ao
na seo 4 ao problema em pauta, tem-se que na eixo da barragem em metros e a feio onde a haste
interpolao por Sries Temporais, por meio do uso est instalada.
do software Statgraphics Centurium XV, o modelo A Figura 6, mais adiante, mostra o grfico das
foi escolhido automaticamente, segundo o critrio leituras das 72 hastes de extensmetros durante
de Akaike (AIC), observando-se, tambm, a raiz o perodo analisado. As linhas foram coloridas
do erro quadrtico mdio (REQM ou RMSE Root conforme o grupo a que as hastes pertencem (preto,
Mean Squared Error). Foi observado o periodograma azul e amarelo para grupos 1, 2 e 3, respectivamente),
acumulado dos resduos e, em alguns casos, aps podendo assim, identificar visualmente a distino
anlise dos valores-p nos testes t dos parmetros, o entre os grupos.
modelo foi substitudo por outro considerado mais A Tabela 3, por sua vez, mostra os coeficientes
adequado. de correlao multivariada aplicada s hastes do
Realizadas as interpolaes por Sries Temporais, grupo 1, deste 2 corte. Deve-se salientar que a
foi ento aplicada a Anlise de Agrupamento (Mtodo anlise aqui mostrada, foi feita somente para o
de Ward), utilizando-se o mesmo software. O grupo 1, do 2 corte, por ser o grupo cujas hastes
dendrograma da Figura 5 mostra a formao dos grupos de extensmetros so de extrema importncia no
para os dados de Itaipu (72 hastes de extensmetros). monitoramento da barragem. Deve-se salientar que
Observando-se o 1. corte da Figura 5, resultam uma anlise semelhante tambm poderia ser feita aos
dois grupos. O primeiro grupo, denominado grupo 1, demais grupos ou ento para quaisquer subconjuntos
um grupo formado por hastes de extensmetros de dados disponibilizados pela Itaipu.
extremamente importantes para o monitoramento da Valores maiores que 0,5 foram coloridos em
barragem; so hastes instaladas no eixo do bloco, a vermelho (correlao alta) e valores menores que 0,5
montante da barragem e inclinados 60 a montante. foram coloridos em azul (correlao baixa) na referida
O segundo grupo, grupo 2, formado pelas demais Tabela 3. Pode-se observar que, para a maioria das
hastes. hastes de extensmetros, a correlao alta. A haste
Observando-se o 2. corte, tem-se a formao de extensmetro equip26_1 a nica cuja correlao
de trs grupos. O primeiro grupo coincide com o com as outras hastes menor.
grupo 1, definido pelo primeiro corte. O segundo J com as tcnicas de VI, foi possvel a comparao
grupo, denominado grupo 2, possui a maioria das e o surgimento de novas interpretaes para o referido
hastes de extensmetros instaladas nos derrames corte 2, grupo 1. A Figura 7, apresentada a seguir,
baslticos B, C e D (A e B so camadas de rochas mais foi gerada pelo software ParVis (disponvel em:
profundas; C e D so camadas de rochas superficiais) http://home.subnet.at/flo/mv/parvis/) e utiliza a
e nos contatos litolgicos B/C e C/D. O terceiro grupo, tcnica Coordenadas Paralelas para visualizar os
denominado grupo 3, possui a maioria das hastes de dados das 72 hastes de extensmetros do trecho
extensmetros instaladas nas juntas (entre camadas F da barragem de Itaipu. Observe-se que os eixos
rochosas) A e B e no contato litolgico A/B. Nota-se foram propositadamente ordenados conforme ordem
aqui que os instrumentos foram agrupados segundo gerada pelo Mtodo de Ward para este grupo (ver
as caractersticas geolgicas relevantes do macio dendrograma da Figura 5).
de fundao, mesmo no tendo sido explicitamente Como era de se esperar, a Figura 7 induz a concluir
apresentadas aos mtodos de MD. que, em geral, estas hastes realmente esto bem
Observando-se o 3. corte, o grupo 1 continua o relacionadas, comprovando a semelhana existente
mesmo dos demais cortes; o grupo 2 foi dividido entre elas, j observada pela tcnica de Ward. Nesta
em dois grupos denominados grupo 2_1 e grupo Figura 7, observa-se que algumas hastes so mais
2_2. Destaca-se o grupo 2_2, que formado, em semelhantes entre si; destacam-se os grupos {equip1_1
sua maioria, por hastes de extensmetros instalados e equip1_2} e {equip4_1 e equip4_2} pela existncia
no derrame B. O grupo 3 foi dividido em dois de poucos cruzamentos entre as linhas que ligam os
grupos denominados grupo 3_1 e grupo 3_2. eixos correspondentes a estas variveis. Da mesma
Dyminski et al. (2008) apresentam uma metodologia forma, como j observado pela Tabela 3 (coeficientes
para identificar as hastes de extensmetros mais de correlao), possvel verificar aqui, tambm, a
importantes nestes cinco grupos, utilizando a Anlise semelhana entre alguns grupos de hastes, o caso de
Fatorial aplicada dentro de cada grupo. {equip1_1 e equip1_2; coeficiente=0,97}, {equip4_1 e
Para um melhor entendimento, considerando os equip4_2; coeficiente=0,99} e {equip6_1 e equip6_2;
trs grupos formados por meio, especificamente, coeficiente=0,99}.
do 2 corte, apresenta-se a Tabela 2, a seguir. Nesta Esta tcnica (Coordenadas Paralelas) apresenta
Tabela 2, apresentada cada uma das 72 hastes dos a grande vantagem da visualizao imediata dos
extensmetros separadas por grupo (conforme o resultados, porm, como desvantagem, no permite
Tcnicas de minerao visual de dados aplicadas aos dados de instrumentao da barragem de Itaipu 729

analisar o relacionamento entre variveis que no XmdvTool (WARD et al., 2007), que as hastes so
estejam em eixos vizinhos. Desta forma no se altamente correlacionveis, ou seja, o aumento de uma
pode, por exemplo, saber o relacionamento entre as implica num aumento da outra. Esta concluso pode
variveis {equip6_1 e equip6_2}. Porm, de forma ser extrada da matriz analisando-se a distribuio
interativa, possvel alterar a posio dos eixos dos pontos como, por exemplo, na linha da haste
permitindo analisar o relacionamento entre quaisquer equip1_1 e coluna da haste equip1_2, os dados
pares de variveis. esto distribudos se aproximando de uma reta
Outra forma de analisar o relacionamento entre crescente o que induz a um bom relacionamento
pares de variveis, mostrada na Figura 8, a seguir, entre estas variveis.
pela aplicao da tcnica matriz de disperso. Da mesma forma, possvel analisar o relacio-
Pode-se observar nesta matriz, gerada pelo software namento entre outras variveis, o caso de {equip1_1

Figura 5. Dendrograma mostrando a formao dos grupos por meio do Mtodo Ward.

Figura 6. Grfico das 72 hastes de extensmetros durante o perodo analisado.


730 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010

Tabela 2. As 72 hastes de extensmetros enquadradas em cada um dos trs grupos da Figura 5 (2. corte).
Grupo Haste Inclinao Afastamento do eixo da barragem Feio
1 equip 1_1 60 a M 125,5 m a M Junta B
1 equip 1_2 60 a M 105,4 m a M Contato B_C
1 equip 4_1 60 a M 65,3 m a M Contato C_D
1 equip 4_2 60 a M 60,4 m a M Rocha Fraturada
1 equip 6_1 60 a M 150,8 m a M Junta A
1 equip 6_2 60 a M 110,5 m a M Derrame B
1 equip 21_1 60 a M 159,8 m a M Junta A
1 equip 21_2 60 a M 135,1 m a M Derrame B
1 equip 26_1 60 a M 139,2 m a M Junta B
1 equip 26_2 60 a M 115,6 m a M Contato B_C
1 equip 31_1 60 a M 64,7 m a M Contato C_D
2 equip 2_1 0 32,0m a M Contato C_D
2 equip 2_2 0 32,0 m a M Rocha Fraturada
2 equip 3_1 0 32,0 m a M Derrame C
2 equip 3_2 0 32,0 m a M Derrame D
2 equip 5_1 0 13,0 m a J Contato C_D
2 equip 5_2 0 13,0 m a J Derrame D
2 equip 7_3 0 13,0 m a J Derrame B
2 equip 8_2 0 84,0 m a M Rocha Fraturada
2 equip 8_3 0 84,0 m a M Derrame B
2 equip 12_1 60 a J 47,2 m a J Rocha Fraturada
2 equip 12_2 60 a J 42,5 m a J Basalto Denso
2 equip 13_2 0 44,0 m a J Rocha Fraturada
2 equip 13_3 0 44,0 m a J Derrame B
2 equip 14_2 0 54,0 m a J Rocha Fraturada
2 equip 14_3 0 54,0 m a J Derrame B
2 equip 15_1 0 80,0 m a M Rocha Fraturada
2 equip 15_2 0 80,0 m a M Derrame B
2 equip 18_3 0 33,0 m a J Derrame B
2 equip 19_3 0 55,0 m a J Derrame B
2 equip 20 _2 0 82,0 m a M Rocha Fraturada
2 equip 20_3 0 82,0 m a M Derrame B
2 equip 23_3 0 36,0 m a J Rocha Fraturada
2 equip 24_3 0 62,0 m a J Derrame B
2 equip 25_2 0 75,0 m a M Derrame B
2 equip 25_3 0 75,0 m a M Derrame B
2 equip 27_1 30 a M 16,6 m a J Junta B
2 equip 27_2 30 a M 22,6 m a J Contato B_C
2 equip 29_2 30 a J 55,7 m a J Contato B_C
2 equip 32_1 30 a M 36,5 m a M Junta B
2 equip 32_2 30 a M 14,6 m a M Derrame C
2 equip 32_3 30 a M 7,5 m a M Contato C_D
2 equip 33_1 0 0,0 Junta B
2 equip 33_2 0 0,0 Derrame C
2 equip 33_3 0 0,0 Contato C_D
2 equip 34_3 30 a J 7,5 m a J Contato C_D
2 equip 35_1 90 a M 0,0 Concreto
2 equip 35_2 90 a M 0,0 Concreto
3 equip 7_1 0 13,0 m a J Junta A
3 equip 7_2 0 13,0 m a J Contato A_B
3 equip 8_1 0 84,0 m a M Contato A_B
3 equip 11_1 0 81,0 m a M Junta A
3 equip 13_1 0 44,0 m a J Contato A_B
3 equip 14_1 0 54,0 m a J Contato A_B
3 equip 18_1 0 33,0 m a J Junta A
3 equip 18_2 0 33,0 m a J Rocha Fraturada
3 equip 19_1 0 55,0 m a J Junta A
3 equip 19_2 0 55,0 m a J Rocha Fraturada
3 equip 20_1 0 82,0 m a M Rocha Fraturada
3 equip 22_1 0 68,0 m a M Junta A
3 equip 22_2 0 68,0 m a M Rocha Fraturada
3 equip 22_3 0 68,0 m a M Derrame B
3 equip 23_1 0 36,0 m a J Junta A
3 equip 23_2 0 36,0 m a J Rocha Fraturada
3 equip 24_1 0 62,0 m a J Junta A
3 equip 24_2 0 62,0 m a J Rocha Fraturada
3 equip 25_1 0 75,0 m a M Junta A
3 equip 28_1 0 40,0 m a J Junta B
3 equip 28_2 0 40,0 m a J Contato B_C
3 equip 29_1 30 a J 63,5 m a J Junta B
3 equip 34_1 30 a J 36,6 m a J Junta B
3 equip 34_2 30 a J 21,0 m a J Derrame C
Tabela 3. Coeficientes de Correlao Multivariada aplicada s hastes do grupo 1, 2 corte.
equip1_1 equip1_2 equip4_1 equip4_2 equip6_1 equip6_2 equip21_1 equip21_2 equip26_1 equip26_2 equip31_1
equip1_1 1 0,973789 0,8894156 0,910016 0,8256753 0,767965 0,8401519 0,8630023 0,5143424 0,9108726 0,57704335
equip1_2 0,97 1 0,8195501 0,847656 0,7524794 0,676221 0,8361274 0,8297473 0,4709566 0,938734 0,46222959
equip4_1 0,89 0,82 1 0,990258 0,8845925 0,882776 0,7863462 0,8403169 0,593878 0,7894659 0,79846531
equip4_2 0,91 0,85 0,99 1 0,8930264 0,882633 0,8221118 0,8644494 0,5160937 0,8282038 0,77197724
equip6_1 0,83 0,75 0,88 0,89 1 0,989003 0,9105697 0,956394 0,3662914 0,7319502 0,82526618
equip6_2 0,77 0,68 0,88 0,88 0,99 1 0,8576867 0,9165347 0,3804936 0,6555618 0,87195133
equip21_1 0,84 0,84 0,79 0,82 0,91 0,86 1 0,9809751 0,1967116 0,8470128 0,60943684
equip21_2 0,86 0,83 0,84 0,86 0,96 0,92 0,98 1 0,2823973 0,8159251 0,69100332
equip26_1 0,51 0,47 0,59 0,52 0,37 0,38 0,2 0,28 1 0,3582111 0,44396828
equip26_2 0,91 0,94 0,79 0,83 0,73 0,66 0,85 0,82 0,36 1 0,48
equip31_1 0,58 0,46 0,8 0,77 0,83 0,87 0,61 0,69 0,44 0,48 1
Tcnicas de minerao visual de dados aplicadas aos dados de instrumentao da barragem de Itaipu
731
732 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010

e equip1_2}, {equip4_1 e equip4_2}, {equip6_1 e Pixel, em que os pixels so mapeados conforme valores
equip6_2} e {equip21_1 e equip21_2}. da matriz de dados; b) tcnica Faces de Chernoff,
A Figura 9, a seguir, gerada pelo software MatLab, que mapeia as informaes seguindo caractersticas
mostra o uso de trs tcnicas: a) tcnica Orientada a baseadas em cones, caractersticas faciais (tamanho

Figura 7. Uso da tcnica Coordenadas Paralelas para a visualizao dos dados das hastes de extensmetros (grupo 1, 2. corte).

Figura 8. Representao da tcnica matriz de disperso para as hastes de extensmetros (grupo 1, 2. corte).

Figura 9. Uso das tcnicas a) Orientadas a Pixel, b) Faces de Chernoff e c) Star Glyphs na anlise de relacionamentos entre
hastes de extensmetros (grupo 1, 2 corte).
Tcnicas de minerao visual de dados aplicadas aos dados de instrumentao da barragem de Itaipu 733

do rosto, tamanho e forma das sobrancelhas, etc.); e Para o desenvolvimento do trabalho, foram obtidos
c) tcnica Star Glyphs, que representa os atributos os dados relativos a 72 hastes de extensmetros
pelas pontas das estrelas com tamanho proporcional localizados no bloco F da barragem no decorrer de
ao valor representado. 120 meses. Na anlise de agrupamento, foi mostrada
Observando-se a Figura 9a, pode ser visto que a formao de possveis 2, 3 ou 5 grupos (Figura 5).
algumas hastes so mais semelhantes entre si. o Pode-se observar justificativas tcnicas para tais
caso de {equip1_1, equip1_2, equip21_1, equip21_2 formaes. No grfico das leituras das hastes de
e equip26_2} e {equip4_1, equip4_2, equip6_1, extensmetros (Figura 6), por exemplo, foi possvel
equip6_2, equip26_1 e equip31_1}. J nas Figuras 9b identificar visualmente a formao de 3 grupos.
e 9c, esta semelhana ocorre em {equip1_1, equip1_2, A sequncia da anlise deu-se sobre a formao dos
equip21_1, equip21_2 e equip31_1} e {equip4_1, 3 grupos (2. corte, Figura 5), do qual selecionou-se o
equip4_2, equip6_1, equip6_2, equip26_1 e equip26_2}. grupo 1, por conter instrumentos bastante importantes
Considerando-se todas as tcnicas abordadas, para o monitoramento da barragem. Para este grupo 1
pode-se dizer que, de uma forma geral, no grupo 1 de instrumentos, mostrou-se que, para a maioria das
(2 corte) analisado, todas as hastes possuem bons hastes de extensmetros, a correlao alta (Tabela 3),
relacionamentos, porm, como visto pelas diversas justificando mais uma vez a formao deste grupo.
tcnicas, algumas hastes so mais semelhantes entre si. Com as tcnicas de VI aplicadas ao grupo 1
Algumas tcnicas so mais refinadas do que outras (2 corte), obtido pelo Mtodo de Ward, foi possvel a
(por exemplo, o dendrograma apresentado quando comparao e o surgimento de novas interpretaes,
aplicado Anlise de Agrupamento pelo Mtodo sendo que a grande vantagem destas tcnicas a
Ward, mostra a similaridade entre as hastes em todos visualizao imediata dos resultados. Com a tcnica
os nveis), enquanto que outras so mais facilmente de Coordenadas Paralelas (Figura 7), por exemplo, foi
interpretadas (por exemplo, as Faces de Chernoff). possvel concluir que, em geral, as hastes do grupo 1
Os resultados atingiram as expectativas esperadas e esto realmente bem relacionadas. Estas tcnicas
as tcnicas de VI integradas s de MD mostraram ser permitem, sem a necessidade de conhecimentos
eficientes do ponto de vista computacional e facilidade em reas como estatstica ou matemtica, analisar
de uso. No entanto, devido grande quantidade de
visualmente a imagem formada pelas variveis e
tcnicas, a escolha daquelas que melhor se ajustam
nela, intuitivamente, formar os grupos.
aos dados em anlise no uma tarefa fcil e devem
Este tipo de abordagem mostrou-se bastante til no
ser escolhidas de acordo com o que se est buscando.
agrupamento de instrumentos segundo sua relevncia
em relao ao comportamento da barragem, bem como
6 Concluses os agrupou segundo critrios no explicitados no banco
Neste artigo apresentada a abordagem de um de dados, como a localizao em diferentes feies
importante problema de engenharia, anlise de geolgicas. Anomalias em leituras de instrumentos
dados de instrumentao de grandes obras, usando tambm podem ser facilmente detectadas, pois as
tcnicas de MVD. Como aplicao destas tcnicas, correlaes com os demais instrumentos devero
procurou-se conhecer o relacionamento entre os dados mudar abruptamente caso aconteam. Desta forma,
de instrumentao da barragem de Itaipu, o qual a introduo de tcnicas de MVD em sistemas de
foi tratado por meio do processo KDD. Para tanto, tomada de deciso bastante recomendvel.
foram utilizadas tcnicas para o pr-processamento
e agrupamento de dados e de relacionamento entre Agradecimentos
os dados dentro de um mesmo grupo.
Para o agrupamento de dados, que uma das Os autores agradecem equipe de Engenharia Civil
possveis tarefas desempenhadas pela MD, foi utilizado da Itaipu Binacional o apoio tcnico, FINEP o apoio
o Mtodo de Ward. J para verificar o relacionamento financeiro ao projeto CT-HIDRO AIEVC Anlise
entre os dados, em cada um dos grupos obtidos por de Incertezas e Estimao de Valores de Controle para
este mtodo, foram utilizadas algumas tcnicas de o Sistema de Monitorao Geotcnico-Estrutural na
VI: coordenadas paralelas; matriz de disperso; Barragem de Itaipu e CAPES a bolsa concedida
orientada a pixel; faces de Chernoff e Star Glyphs. segunda autora.
Conhecer o relacionamento entre os instrumentos
de uma barragem de suma importncia, pois, se Referncias
sabendo destas relaes, ao ocorrer uma anomalia ANKERST, M.; KEIM, D. Visual data mining and
num determinado instrumento em leituras futuras, exploration of large databases. In: EUROPEAN
os outros instrumentos relacionados devero ser CONFERENCE ON PRINCIPLES AND PRACTICE
analisados para confirmar a anomalia, fazendo com OF KNOWLEDGE DISCOVERY IN DATABASES,
que as medidas cabveis sejam tomadas pela empresa. 5., 2001, Freiburg, Proceedings
734 Silva Neto et al. Gest. Prod., So Carlos, v. 17, n. 4, p. 721-734, 2010

ARTERO, A. O. Estratgias para apoiar a deteco JOHNSON, R. A.; WICHERN, D. W. Applied multivariate
de estruturas em visualizaes multidimensionais statistical analysis. 4. ed. Upper Saddle River: Prentice
percentualmente sobrecarregadas. 2005. Tese (Douto- Hall, 1998.
rado) Universidade de So Paulo, So Carlos, 2005. KACHIGAN, S. K. Statistical analysis: an interdisciplinary
BOX, G. E. P.; JENKINS, G. M. Time series analysis, introduction to univariate and multivariate methods.
forecasting and control. San Francisco: Holden Day, New York: Radius Press, 1986.
1976. KEIM, D. A. Visual exploration of large data sets.
BRASIL. Projeto de Lei n 1.181, de 2003. Estabelece Communications of the ACM, v. 44, n. 8, p. 38-44, 1979.
diretrizes para verificao da segurana de barragens KEIM, D. A.; KRIEGEL, H. P. Visualization techniques
de cursos de gua para quaisquer fins e para aterros de for mining large databases: a comparison. IEEE Trans.
conteno de resduos lquidos industriais. Disponvel Knowledge & Data Engineering, v. 8, n. 6, p. 923-936,
em: <http://www.emtermos.com.br/ABMS/PL_1181. 1996.
pdf>. Acesso em: 19 jun. 2009. MATOS, S. F. Avaliao de instrumentos para
CHERNOFF, H. The use of faces to represent points in auscultao de barragem de concreto. Estudo de
K-dimensional space graphically. Journal of American Caso: deformmetros e tensmetros para concreto na
Statistical Association, v. 68, p. 361-368, 1973. barragem de Itaipu. 2002. Dissertao (Mestrado em
COMIT BRASILEIRO DE GRANDES BARRAGENS Engenharia Civil)Universidade Federal do Paran,
CBGB. Diretrizes para a inspeo e avaliao de Curitiba, 2002.
segurana de barragens em operao. Rio de Janeiro, PICKETT, R. M.; GRINSTEIN, G. G. Iconographic
1983. displays for visualizing multidimensional data. In:
IEEE CONFERENCE ON SYSTEMS, MAN AND
DINIZ, C. A. R.; LOUZADA NETO, F. Data mining:
CYBERNETICS, 1988, Piscataway. Proceedings
uma introduo. So Paulo: ABE, 2000.
REZENDE, S. O. Sistemas inteligentes: fundamentos e
DYMINSKI, A. S.; STEINER, M. T. A.; VILLWOCK, R.
aplicaes. Barueri: Manole, 2003.
Hierarchical ordering of extensometers readings from
SILVA NETO, M. A. Minerao visual de dados: extrao
Itaipu dam. In: INTERNATIONAL SYMPOSIUM
do conhecimento a partir de tcnicas de visualizao
ON LIFE-CYCLE CIVIL ENGINEERING, Varenna,
da informao e minerao de dados. Experimentos:
2008. Proceedings
ITAIPU e SIMEPAR. 2008. Dissertao (Mestrado em
FAYYAD, U.M. et al. Advances in knowledge discovery
Mtodos Numricos em Engenharia)Universidade
and data mining. Massachusetts: AAAI Press, 1996. Federal do Paran, Curitiba, 2008.
FREITAS, A. A. Data mining and knowledge discovery SILVEIRA, J. F. A. Instrumentao e comportamento
with evolutionary algorithms. New York: Springer, 2002. de fundaes de barragens de concreto. So Paulo:
GIMENES, E. Data Mining Data Warehouse: a Oficina de Textos, 2003.
importncia da minerao de dados em tomadas de SILVER, D. L. Knowledge discovery and data mining.
decises. 2000. Monografia de concluso de curso Technical Report MBA6522. CogNova Technologies
(Tecnlogo em Processamento de Dados)Centro London Health Science Center, 1996.
Estadual de Educao Tecnolgica Paula Souza, TAN, P. N.; STEINBACH, M.; KUMAR, V. Introduction to
Faculdade de Tecnologia de Taguaritinga, Taquaritinga, data mining. Boston: Addison-Wesley Longman, 2005.
2000. WARD, M. O. et al. XmdvTool release: the multivariate
HAIR JUNIOR, J. F. et al. Anlise multivariada de dados. data visualization tool. Disponvel em: <http://davis.
So Paulo: Bookman, 2005. wpi.edu/~xmdv/>. Acesso em: 26 jan. 2007.
INTERNATIONAL COMMISSION ON LARGE DAMS WITTEN, I. H.; FRANK, E. Data mining: practical machine
ICOLD. Ttulo do texto/diretriz que foi consultada. learning tools and techniques with Java implementations.
Disponvel em: <http://www.icold-cigb.org>. Acesso San Francisco: Morgan Kaufmann, 2000.
em: dia ms 2008. WARD, M. O. XmdvTool: integrating multiple methods for
ITAIPU. ITAIPU Binacional. Disponvel em: <http://www. visualizing multivariate data. In: IEEE VISUALIZATION,
itaipu.gov.br>. Acesso em: dia ms 2008. 1994, Washington, DC. Proceedings
JAIN, A. K.; MURTY, M. N.; FLYNN, P. J. Data clustering: WONG, P. C. Visual data mining. IEEE Computer
a review. ACM Computing Surveys, v. 31, n. 3, 1999. Graphics and Applications, v. 19, n. 5, p. 20-21, 1999.

You might also like