You are on page 1of 52

Linguagens Documentrias

Profa. Lillian Alvares


Faculdade de Cincia da Informao, Universidade de Braslia
Contexto
Organizao da Informao...
... procura criar mtodos e instrumentos para elaborar
informao documentria...
... Indexar, resumir e construir linguagens de
representao so os termos tcnicos que
denominam essas operaes
Contexto
A questo :
Como organizar a informao para que o conhecimento
fique disponvel?
Contexto
Pelas Linguagens Documentrias, pois...
...elas esto contidas no contextos de produo e de
busca de informao...
... parte constitutiva da preocupao com a
recuperao da informao.
Contexto
Uma das condies para plena recuperao de
informao o uso de Linguagens Documentrias
Contexto
As Linguagens Documentrias so instrumentos privilegiados
de mediao que apresentam dupla funo:
Contexto
a) representar o conhecimento
b) promover interao entre usurio e contedo.
Principais interseces interdisciplinares
Lingustica: o princpio estrutural da organizao da
linguagem
Terminologia: a modelagem do conceito e dos sistemas de
conceitos, onde, glossrios e dicionrios terminolgicos
especializados so seus produtos
Lgica: a identificao das formas de raciocnio e de
organizao de conjuntos
Campos para atuao...
No exclusivo dos Bibliotecrios e Documentalistas;
reas de aplicao: Filosofia, Informtica, Inteligncia Artificial,
Engenharia, Psicologia entre outros....
Contexto
As LD constituem uma espcie de cdigo de traduo que
tem, entre suas funes, a normalizao das representaes
documentrias como meio de viabilizar sua comunicao.
Contexto
Essa traduo que permite a transformao de
informaes dos textos em linguagem natural e/ou
especializada para uma linguagem documentria
controlada, envolve a questo da significao:
Como representar adequadamente as informaes sem
comprometer o seu significado?
Resultados da traduo
Contexto
LD so instrumentos que no permitem a recuperao
da dinamicidade dos textos
um dos seus objetivos o de fornecer uma verso
extremamente econmica dos textos originais
por intermdio, do destaque das informaes
consideradas centrais nos documentos.
Contexto
LD e textos so construes de natureza distinta, por isso..
... na operao de converso perde-se a
especificidade do texto original em prol da
generalizao.
Definies
Definies
So linguagens artificialmente construdas que visam
traduzir sinteticamente contedos documentais,
utilizadas nos sistemas documentrios para indexao,
armazenamento e recuperao da informao.
Definies
um conjunto controlado de termos usado para
representar os assuntos dos documentos.
Definies
O objetivo da LD o controle de vocabulrio, isto ,
controlar a terminologia de rea ou reas do
conhecimento por meio do estabelecimento de um
conceito/interpretao definido aos termos de acordo com as
necessidades de uso do sistema.
Definies
A utilizao de uma LD para escolha do termo correto para
descritor reduz a diversidade e a ambiguidade da
terminologia e estabelece a eficcia com que o indexador
pode descrever o assunto dos documentos, j que vrios
autores podem se utilizar de diferentes palavras para
expressar uma mesma idia.
Definies
S podem cobrir conceitos de um domnio especfico do
conhecimento humano, no havendo assim, linguagens
documentrias gerais.
Definies
Visam a uniformizao do uso de linguagens especializadas...
...proporcionando uma representao padronizada do
contedo informacional...
... bem como uma recuperao da informao
mais pertinente.
Definies
As palavras (que descrevem as informaes ou descritores)
so os elementos que compem as linguagens documentrias.
So extrados da linguagem natural
Terminologia
Tipos de linguagem
Linguagem Natural
Linguagem Documentria, tambm conhecida como:
Linguagem Controlada
Linguagem de Indexao
Linguagem Descritoras
Codificaes Documentrias
Medidas de Eficcia
24
Revocao e Preciso
Todos os documentos
Documentos relevantes
Documentos retornados
Relevantes retornados
= Revocao
= Preciso
Revocao ou Recall
26
Relao entre o nmero de documentos relevantes sobre
determinado tema, recuperados pelo sistema, e o nmero total
de documentos sobre o tema, existentes nos registros do
mesmo sistema.
Preciso ou relevncia
27
Refere-se qualidade dos documentos recuperados pelo
sistema, para atendimento dos pedidos relativos a temas
especficos, encaminhados por usurios diversos.
Documentos relevantes retornados dividido pelo nmero total
de retornados
Linguagens Pr-Coordenadas e
Linguagens Ps-Coordenadas
Linguagens
Pr-Coordenadas
Linguagens pr-coordenadas
Combinao feita na etapa de entrada das palavras, na
indexao.
Os assuntos so representados por um conjunto de
termos j combinados.
Exemplo: lbum de fotografia
Linguagens pr-coordenadas
Devem contemplar todas as possibilidades de
combinao entre os termos para formar assuntos
complexos.
So palavras, termos ou frases escolhidas para expressar
um conceito ou uma combinao de conceitos de
indexao
Linguagens pr-coordenadas
Adota:
VER: remete ao termo adotado como entrada (sinnimos,
termos especficos para termos genricos)
VER TAMBM: remete a assuntos relacionados.
Complementa a informao para o usurio
Linguagens pr-coordenadas
Trazem problemas indexao, devido, principalmente,
impossibilidade de prever todas as alternativas de
relacionamento entre conceitos.
Linguagens pr-coordenadas
O nmero e a preciso dos termos de uma lista podem
levar a crer numa busca facilitada.
No so flexveis para permitir uma busca por qualquer
termo que compe o cabealho.
Linguagens pr-coordenadas
Podem ser de dois tipos:
Classificatrias (Classificaes)
Alfabticas (Cabealhos de assunto)
Desvantagens
Necessitam de entradas mltiplas para explicitar todos os
conceitos significativos
Difceis de atualizar, pouco dinamismo
Menor flexibilidade na indexao
Relaes estticas
Menor revocao
Linguagens
Ps-Coordenadas
Linguagens ps-coordenadas
Combinao feita no momento da sada, na recuperao da
informao.
Utilizao de operadores booleanos: E, OU, NO
Exemplo: lbum E fotografia para recuperar lbum de
fotografia
Vantagens
Dinmicas, novos termos podem ser includos com maior
rapidez
Relaes multidimensionais entre termos
Todos os termos so pontos de acesso
Maior flexibilidade na indexao
Desvantagens
Geram falsa recuperao, necessitam de artifcios para
evit-la
Exigem maior esforo na busca
Linguagem Natural (LN) e
Linguagem Documentria (LD)
LN LD
A parte oral mais importante. So fundamentalmente escritas.
So gerais So especializadas
So estabelecidas e adaptadas atravs
de longos perodos de tempo e por
muitas pessoas.
So estabelecidas em poucos
anos por um nmero reduzido de
pessoas
A sinonmia e a polissemia so fatos
naturais das LN. Aceitam ambigidades
No aceitamambiguidades.
No comportam polissemias e
e se esforam por evitar as sinonmias.
So naturalmente aceitas e adquiridas
pelos usurios
Devem ser aceitas
pelos usurios.
Interessamos aspectos fonolgicos,
semnticos e sintticos
Interessamsomente os aspectos
semnticos e sintticos
So naturais So artificiais
LN LD
So menos eficientes que as LD
nas operaes de recuperao da
informao
So mais eficientes que as LN
nas operaes de recuperao da
informao
So instrumentos de comunicao So instrumentos de comunicao
Tmsua prpria estrutura Sua estrutura baseia-se na estrutura
da LN sobre a qual elas so formadas
Necessitamde hierarquias para evitar
malformaes gramaticais
Necessitamde hierarquias para evitar
malformaes gramaticais.
So sensveis a mudanas culturais So sensveis a mudanas culturais
No tmuma funo especfica Tm um propsito especfico e
um nvel de funes
VANTAGENS DESVANTAGENS
Se bem construdo, o vocabulrio
controlado poder oferecer alta preciso
e revocao, e tambm ampliar a
confiana do usurio frente a um
possvel resultado negativo
Um rgido vocabulrio controlado
poder no refletir os objetivos
da base de dados
As relaes hierrquicas e as remissivas
do vocabulrio controlado auxiliam tanto
o indexador, quanto o usurio na
identificao de conceitos relacionados
Necessidade de treinamento no
uso dos vocabulrios controlados
tanto para os intermedirios, quanto
para os usurios finais
LD: Vantagens e desvantagens
VANTAGENS DESVANTAGENS
Reduo no tempo de consulta base,
pois a estratgia de busca ser melhor
elaborada com o uso do vocabulrio
controlado
Desatualizao do vocabulrio
poder conduzir a resultados falsos
LD: Vantagens e desvantagens
Aumenta a preciso
VANTAGENS DESVANTAGENS
Controle total do vocabulrio de
indexao, minimizando os problemas de
comunicao entre os indexadores e os
usurios
Custos: a produo e manuteno
da base de dados tero despesas
maiores com a equipe de
indexadores. Ter ainda que,
manter pessoal especializado na
atualizao do vocabulrio
Promove a consistncia/coerncia na
indexao
LD: Vantagens e desvantagens
Linguagem Natural
VANTAGENS DESVANTAGENS
Permite o imediato registro da
informao numa base de dados, sem
necessidade de consulta a uma
linguagem de controle
Os usurios, no processo de busca,
precisam fazer um esforo
intelectual maior para determinar
os sinnimos, as grafias
Processo de busca facilitado com a
ausncia de treinamentos especficos
no uso da linguagem de controle
Haver uma alta incidncia de
respostas negativas ou de
relaes entre os termos usados na
busca (por ausncia de
padronizao)
Termos de indexao so extrados
diretamente dos documentos que vo
compor a base de dados
Custos de acesso tendem a
aumentar com a entrada de
termos aleatrios
LN: Vantagens e desvantagens
VANTAGENS DESVANTAGENS
Termos especficos citados nos
documentos podem ser encontrados
Uma estratgia de busca que
arrole todos os principais
conceitos e seus sinnimos deve
ser elaborada para cada base de
dados
Elimina os conflitos de comunicao
entre os indexadores e os usurios,
pois, ambos tero acesso aos mesmos
termos
Perda de confiana do usurio
numa possvel resposta negativa
LN: Vantagens e desvantagens
Tipos de LD
Tipos
Pr-coordenadas Ps-coordenadas
Sistemas de classificao
Listas de cabealhos de
assuntos
Glossrios
Dicionrios
Vocabulrios controlados
Tesauro
Taxonomias
Ontologias
Referncia
KOBASHI, Nair Yumiko. Fundamentos semnticos e
pragmticos da construo de instrumentos de representao
de informao. DataGramaZero: Revista de Cincia da
Informao, v.8, n.6, dez, 2007.

You might also like