Faculdade de Cincia da Informao, Universidade de Braslia Contexto Organizao da Informao... ... procura criar mtodos e instrumentos para elaborar informao documentria... ... Indexar, resumir e construir linguagens de representao so os termos tcnicos que denominam essas operaes Contexto A questo : Como organizar a informao para que o conhecimento fique disponvel? Contexto Pelas Linguagens Documentrias, pois... ...elas esto contidas no contextos de produo e de busca de informao... ... parte constitutiva da preocupao com a recuperao da informao. Contexto Uma das condies para plena recuperao de informao o uso de Linguagens Documentrias Contexto As Linguagens Documentrias so instrumentos privilegiados de mediao que apresentam dupla funo: Contexto a) representar o conhecimento b) promover interao entre usurio e contedo. Principais interseces interdisciplinares Lingustica: o princpio estrutural da organizao da linguagem Terminologia: a modelagem do conceito e dos sistemas de conceitos, onde, glossrios e dicionrios terminolgicos especializados so seus produtos Lgica: a identificao das formas de raciocnio e de organizao de conjuntos Campos para atuao... No exclusivo dos Bibliotecrios e Documentalistas; reas de aplicao: Filosofia, Informtica, Inteligncia Artificial, Engenharia, Psicologia entre outros.... Contexto As LD constituem uma espcie de cdigo de traduo que tem, entre suas funes, a normalizao das representaes documentrias como meio de viabilizar sua comunicao. Contexto Essa traduo que permite a transformao de informaes dos textos em linguagem natural e/ou especializada para uma linguagem documentria controlada, envolve a questo da significao: Como representar adequadamente as informaes sem comprometer o seu significado? Resultados da traduo Contexto LD so instrumentos que no permitem a recuperao da dinamicidade dos textos um dos seus objetivos o de fornecer uma verso extremamente econmica dos textos originais por intermdio, do destaque das informaes consideradas centrais nos documentos. Contexto LD e textos so construes de natureza distinta, por isso.. ... na operao de converso perde-se a especificidade do texto original em prol da generalizao. Definies Definies So linguagens artificialmente construdas que visam traduzir sinteticamente contedos documentais, utilizadas nos sistemas documentrios para indexao, armazenamento e recuperao da informao. Definies um conjunto controlado de termos usado para representar os assuntos dos documentos. Definies O objetivo da LD o controle de vocabulrio, isto , controlar a terminologia de rea ou reas do conhecimento por meio do estabelecimento de um conceito/interpretao definido aos termos de acordo com as necessidades de uso do sistema. Definies A utilizao de uma LD para escolha do termo correto para descritor reduz a diversidade e a ambiguidade da terminologia e estabelece a eficcia com que o indexador pode descrever o assunto dos documentos, j que vrios autores podem se utilizar de diferentes palavras para expressar uma mesma idia. Definies S podem cobrir conceitos de um domnio especfico do conhecimento humano, no havendo assim, linguagens documentrias gerais. Definies Visam a uniformizao do uso de linguagens especializadas... ...proporcionando uma representao padronizada do contedo informacional... ... bem como uma recuperao da informao mais pertinente. Definies As palavras (que descrevem as informaes ou descritores) so os elementos que compem as linguagens documentrias. So extrados da linguagem natural Terminologia Tipos de linguagem Linguagem Natural Linguagem Documentria, tambm conhecida como: Linguagem Controlada Linguagem de Indexao Linguagem Descritoras Codificaes Documentrias Medidas de Eficcia 24 Revocao e Preciso Todos os documentos Documentos relevantes Documentos retornados Relevantes retornados = Revocao = Preciso Revocao ou Recall 26 Relao entre o nmero de documentos relevantes sobre determinado tema, recuperados pelo sistema, e o nmero total de documentos sobre o tema, existentes nos registros do mesmo sistema. Preciso ou relevncia 27 Refere-se qualidade dos documentos recuperados pelo sistema, para atendimento dos pedidos relativos a temas especficos, encaminhados por usurios diversos. Documentos relevantes retornados dividido pelo nmero total de retornados Linguagens Pr-Coordenadas e Linguagens Ps-Coordenadas Linguagens Pr-Coordenadas Linguagens pr-coordenadas Combinao feita na etapa de entrada das palavras, na indexao. Os assuntos so representados por um conjunto de termos j combinados. Exemplo: lbum de fotografia Linguagens pr-coordenadas Devem contemplar todas as possibilidades de combinao entre os termos para formar assuntos complexos. So palavras, termos ou frases escolhidas para expressar um conceito ou uma combinao de conceitos de indexao Linguagens pr-coordenadas Adota: VER: remete ao termo adotado como entrada (sinnimos, termos especficos para termos genricos) VER TAMBM: remete a assuntos relacionados. Complementa a informao para o usurio Linguagens pr-coordenadas Trazem problemas indexao, devido, principalmente, impossibilidade de prever todas as alternativas de relacionamento entre conceitos. Linguagens pr-coordenadas O nmero e a preciso dos termos de uma lista podem levar a crer numa busca facilitada. No so flexveis para permitir uma busca por qualquer termo que compe o cabealho. Linguagens pr-coordenadas Podem ser de dois tipos: Classificatrias (Classificaes) Alfabticas (Cabealhos de assunto) Desvantagens Necessitam de entradas mltiplas para explicitar todos os conceitos significativos Difceis de atualizar, pouco dinamismo Menor flexibilidade na indexao Relaes estticas Menor revocao Linguagens Ps-Coordenadas Linguagens ps-coordenadas Combinao feita no momento da sada, na recuperao da informao. Utilizao de operadores booleanos: E, OU, NO Exemplo: lbum E fotografia para recuperar lbum de fotografia Vantagens Dinmicas, novos termos podem ser includos com maior rapidez Relaes multidimensionais entre termos Todos os termos so pontos de acesso Maior flexibilidade na indexao Desvantagens Geram falsa recuperao, necessitam de artifcios para evit-la Exigem maior esforo na busca Linguagem Natural (LN) e Linguagem Documentria (LD) LN LD A parte oral mais importante. So fundamentalmente escritas. So gerais So especializadas So estabelecidas e adaptadas atravs de longos perodos de tempo e por muitas pessoas. So estabelecidas em poucos anos por um nmero reduzido de pessoas A sinonmia e a polissemia so fatos naturais das LN. Aceitam ambigidades No aceitamambiguidades. No comportam polissemias e e se esforam por evitar as sinonmias. So naturalmente aceitas e adquiridas pelos usurios Devem ser aceitas pelos usurios. Interessamos aspectos fonolgicos, semnticos e sintticos Interessamsomente os aspectos semnticos e sintticos So naturais So artificiais LN LD So menos eficientes que as LD nas operaes de recuperao da informao So mais eficientes que as LN nas operaes de recuperao da informao So instrumentos de comunicao So instrumentos de comunicao Tmsua prpria estrutura Sua estrutura baseia-se na estrutura da LN sobre a qual elas so formadas Necessitamde hierarquias para evitar malformaes gramaticais Necessitamde hierarquias para evitar malformaes gramaticais. So sensveis a mudanas culturais So sensveis a mudanas culturais No tmuma funo especfica Tm um propsito especfico e um nvel de funes VANTAGENS DESVANTAGENS Se bem construdo, o vocabulrio controlado poder oferecer alta preciso e revocao, e tambm ampliar a confiana do usurio frente a um possvel resultado negativo Um rgido vocabulrio controlado poder no refletir os objetivos da base de dados As relaes hierrquicas e as remissivas do vocabulrio controlado auxiliam tanto o indexador, quanto o usurio na identificao de conceitos relacionados Necessidade de treinamento no uso dos vocabulrios controlados tanto para os intermedirios, quanto para os usurios finais LD: Vantagens e desvantagens VANTAGENS DESVANTAGENS Reduo no tempo de consulta base, pois a estratgia de busca ser melhor elaborada com o uso do vocabulrio controlado Desatualizao do vocabulrio poder conduzir a resultados falsos LD: Vantagens e desvantagens Aumenta a preciso VANTAGENS DESVANTAGENS Controle total do vocabulrio de indexao, minimizando os problemas de comunicao entre os indexadores e os usurios Custos: a produo e manuteno da base de dados tero despesas maiores com a equipe de indexadores. Ter ainda que, manter pessoal especializado na atualizao do vocabulrio Promove a consistncia/coerncia na indexao LD: Vantagens e desvantagens Linguagem Natural VANTAGENS DESVANTAGENS Permite o imediato registro da informao numa base de dados, sem necessidade de consulta a uma linguagem de controle Os usurios, no processo de busca, precisam fazer um esforo intelectual maior para determinar os sinnimos, as grafias Processo de busca facilitado com a ausncia de treinamentos especficos no uso da linguagem de controle Haver uma alta incidncia de respostas negativas ou de relaes entre os termos usados na busca (por ausncia de padronizao) Termos de indexao so extrados diretamente dos documentos que vo compor a base de dados Custos de acesso tendem a aumentar com a entrada de termos aleatrios LN: Vantagens e desvantagens VANTAGENS DESVANTAGENS Termos especficos citados nos documentos podem ser encontrados Uma estratgia de busca que arrole todos os principais conceitos e seus sinnimos deve ser elaborada para cada base de dados Elimina os conflitos de comunicao entre os indexadores e os usurios, pois, ambos tero acesso aos mesmos termos Perda de confiana do usurio numa possvel resposta negativa LN: Vantagens e desvantagens Tipos de LD Tipos Pr-coordenadas Ps-coordenadas Sistemas de classificao Listas de cabealhos de assuntos Glossrios Dicionrios Vocabulrios controlados Tesauro Taxonomias Ontologias Referncia KOBASHI, Nair Yumiko. Fundamentos semnticos e pragmticos da construo de instrumentos de representao de informao. DataGramaZero: Revista de Cincia da Informao, v.8, n.6, dez, 2007.