You are on page 1of 47

Relembrando fundamentos da representao temtica

Universidade Federal do Rio Grande (FURG) Disciplina Indexao: T & P (2013) Profa. Gisele Dziekaniak giseledziekaniak@yahoo.com.br

http://indexacaoteoriaepraticafurg.blogspot.com.br/

Classificao
Para James Duff Brown a classificao um

processo mental constantemente executado de forma consciente e inconsciente por qualquer ser humano, ainda que no reconhecido como tal. grupos ou classes, segundo as semelhanas e diferenas.

Para Piedade (1983, p. 16) Classificar dividir em

Para Ranganathan classificar era traduzir o nome

dos assuntos dos documentos da linguagem natural para a linguagem artificial adotada pelos sistemas de classificao bibliogrfica. (PIEDADE, 1983)

Caracterstica, classe e categoria


Caracterstica Qualidade ou atributo escolhido para servir de base classificao ou diviso. Pode-se classificar adotando caractersticas distintas para o mesmo objeto. Exemplos: Livros Literatura - Tamanho - Lugar - Cor - Lngua - Lngua - Assunto - Perodo

H tantas possibilidades de classificar quantas forem as semelhanas e diferenas existentes entre os objetos ou ideias a classificar. (PIEDADE, 1983, p. 17)

Classificao cruzada
Pode-se classificar adotando vrias

caractersticas, mas empregando uma de cada vez e aplicando-a a todos os membros da classe. Ex.: caracterstica Sexo para dividir animais racionais, no poderemos empregar, ao mesmo tempo, a caracterstica faixa etria. O emprego simultneo de mais de uma caracterstica se chama Classificao cruzada, quando as classes no so mutuamente excludentes, gerando confuso.

Classificao cruzada
Exemplo correto: Animais Racionais _________________________ Homens ____________
Crianas Adolescentes Adultos

Mulheres _____________
Crianas Adolescentes Adultos

Classificao cruzada
Exemplo incorreto: Se empregssemos, ao mesmo tempo duas caractersticas (Lngua e lugar) Literatura ____________________________________
Em lngua portuguesa Do Brasil De Portugal Em lngua espanhola Do Chile Do Peru etc.

Caracterstica, classe, categoria


Classe o conjunto de coisas ou ideias que possuem um ou vrios atributos, predicados ou qualidades em comum. Ex.: Mamferos, Vertebrados, Canrios, Animais. Categoria So as maiores classes de fenmenos, as classes mais gerais que podem ser formadas. So as grandes classes. Ex: na categoria Lugar, pode-se distinguir as facetas: Lugar fsico, Lugar poltico, Orientao (norte, sul etc.).

Aristteles e a classificao
Aristteles dividiu o conhecimento com base

em trs critrios (NUNES, 2007):


Critrio de ausncia ou presena do homem nos seres investigados; critrio de imutabilidade e critrio de modalidade prtica.

Trata-se de uma hierarquizao conceitual

que divide um tema geral em espcies a partir de uma caracterstica classificatria.

Aristteles e a classificao
Aristteles desenvolveu um sistema filosfico

baseado em uma concepo rigorosa do Universo. Em seus tratados biolgicos, apresentou o sistema de classificao dos animais que no se encontrava completo e que, originariamente em nmero de quatro, foram os seguintes: Gnero Espcie Diferena Propriedade, e Acidente.

Aristteles e a classificao
Metafsica

Porfrio e a classificao
A partir de Aristteles, Porfrio descreve como as

qualidades atribudas s coisas podem ser classificadas, quebrando o conceito filosfico da substncia como um genus/espcie do relacionamento:

Bacon e a classificao
Na classificao baconiana, apesar de

algumas de suas classes e divises se tornarem imbricadas, este sistema foi considerado um dos mais influentes nas diversas tentativas feitas para classificar o conhecimento. A classificao de Bacon est baseada na figura abaixo:

Bacon e sua classificao


MIR (Memria, Imaginao e Razo)

Foi a base para a criao da CDD

Indexao - conceito

Etapas do tratamento temtico


Anlise de assunto

Processo de ler um documento para extrair conceitos que traduzam a essncia do seu contedo. (DIAS, NAVES, 2007, p. 9) Envolve cultura do indexador, experincia, conhecimento lingustico, cognitivo e lgico. Tambm chamada de anlise conceitual, anlise documentria, anlise da informao e subject analysis.

Etapas do tratamento temtico


1) Fases da Anlise de assunto Leitura tcnica do documento (leitura documental) Extrao de conceitos que representam a obra Atinncia - termos em LN (do que trata a obra?)

Sugesto de leitura: Dias e Naves (2007)

Etapas do tratamento temtico


2) Traduo

Passagem dos termos de linguagem natural (LN) para linguagem artificial/documentria (LA/LD). Eleio descritores autorizados pela LD (cabealhos de assunto, palavras-chave, termos de indexao).

Sugesto de leitura: Lancaster (2004)

Anlise documentria
A anlise documentria definida como um

conjunto de procedimentos efetuados com o fim de expressar o contedo dos documentos, sob formas destinadas a facilitar a recuperao da informao. (DIAS, NAVES, 2007, p. 11) Metainformao (informao da informao)

Leitura do bibliotecrio (LUCAS, 2000)


Questes ideolgicas Equvoco da neutralidade Iluso da completude Sujeitos leitores

Dica de leitura: Lucas (2000)

Organizam arquivos Autorizados a ler, escrever e interpretar Como apreenso do documento (literal) Como leitura interpretativa

Tipos de leitura

Subordinao, superordenao e coordenao


Superordenao Meio de transporte Subordinao

Terrestre

Areo

Aqutico

Carro

Moto

Coordenao

Recuperao da Informao - RI
Information Retrieval: Termo cunhado por Calvin

Mooers (dcada de 1950) que engloba aspectos intelectuais da descrio de informaes e suas especificidades para a busca, alm de quaisquer sistemas, tcnicas ou mquinas empregados para o desempenho da operao. a responsvel pela criao e desenvolvimento da Cincia da Informao. (SARACEVIC, 1996) O objetivo recuperar informaes atravs da busca por alguma entrada catalogada a priori.

Sistema de Recuperao da Informao - SRI


Um sistema de informao coleta, processa,

armazena, analisa e dissemina informaes e constitudo por um conjunto de componentes relacionados entre si. (GROSSI, 2008). So sistemas de operaes interligadas para identificar dentre um grande conjunto de informaes, aquelas que sejam teis, de acordo com a demanda expressa pelo usurio. (LOPES, 2002) Objetivo de um SRI permitir que um usurio recupere documentos atravs de caractersticas como: autor, ttulo, assunto ou qualquer combinao desses elementos.

Atividades em um SRI
Representao das informaes contidas nos

documentos; Armazenamento; Gesto fsica e/ou lgica desses documentos e de suas representaes; Recuperao da informao representada e dos prprios documentos armazenados (links). Disseminao da informao.

Sistema de Recuperao da Informao - SRI


Localizao de documentos e itens de

informao que tenham sido objeto de armazenamento. (ROWLEY, 2002, p. 114) Para Cendn (2006) catlogos de bibliotecas, bases de dados bibliogrficas, e motores de busca na internet so exemplos de SRI. (GROSSI, 2008)

Subsistemas dos SRIs


Subsistemas de entrada:

Seleo/aquisio, descrio, representao, organizao de arquivos, armazenamento.


Subsistemas de sada:

Anlise e negociao de questes, estratgia de busca/recuperao, disseminao/acesso ao documento.


Subsistema de avaliao:

No se refere especificamente nem entrada, nem sada, mas a ambos, ao sistema como um todo.

Avaliao dos SRI


Cobertura: Representa quanto o sistema contm informaes relevantes. Exaustividade:

Este conceito relaciona-se ao grau de profundidade com que os assuntos dos documentos so representados.
Preciso:

Relaciona-se com a proporo de itens recuperados que so relevantes.

Avaliao dos SRI


Tempo de resposta:

o intervalo mdio entre o momento da consulta e a apresentao do resultado. Esforo do usurio: o esforo despendido para obter resultados na busca.
Formato: como os resultados so apresentados. So

vrias as caractersticas e tipologias comuns aos diversos sistemas de recuperao da informao, porm um mdulo que todos devem possuir, por ser fundamental, o mdulo de interface com o usurio. (ARAUJO, 1994).

Estratgias de busca em um SRI


Estratgia de busca o conjunto de decises

tomadas e de procedimentos adotados durante uma busca. a tcnica ou conjunto de regras para tornar possvel o encontro entre uma pergunta formulada e a informao armazenada em uma base de dados. (LOPES, 2002). a tcnica ou conjunto de regras para tornar possvel o encontro entre uma pergunta formulada e a informao armazenada em uma base de dados. Uma boa estratgia de busca implica em conhecer a base de dados, as frmulas de busca, o assunto que se busca e/ou a bibliografia que objeto de busca. Identificar a Necessidade de Informao (NI).

Estratgia de busca
NI frmula de busca = resultado SRI

Resposta insatisfatria = RUDO = Usurio insatisfeito = Nova estratgia de busca

Resposta satisfatria = NI satisfeita = Item recuperado = usurio satisfeito

Objetivos da estratgia de busca


Recuperar um nmero suficiente de registros

relevantes e evitar que:


Sejam recuperados itens irrelevantes; Sejam recuperados um nmero excessivo de itens; Sejam recuperados um nmero insignificante de registros.

Problemas em recuperao da informao


Os autores nem sempre usam as mesmas

palavras que os usurios para descrever o mesmo conceito. M formulao da consulta.

Lgica de busca: Operadores booleanos


AND OR NOT E OU NO

Os operadores booleanos tem por objetivo definir como ser a combinao feita entre os termos ou expresses de uma pesquisa.

Lgica de busca: Operadores booleanos


OR/OU

Amplia a pesquisa e tem a inteno de buscar ou esse ou aquele termo. Ou seja, qualquer uma das palavras. Exemplo:
A or B
A
B

Lgica de busca: Operadores booleanos


AND/E

Restringe a pesquisa e significa a expresso que tenha todas as palavras. O resultado da busca deve recuperar ambos os termos. Exemplo:
A and B

Lgica de busca: Operadores booleanos


NOT/NO

Exclui um dos termos da pesquisa. Equivale dizer: sem a seguinte palavra. Exemplo: A not B

Lgica de busca: Operadores booleanos


Podem ser usados em expresses mais

complexas, onde se adotam os parnteses. Ex: (A or B) and C


A pesquisa ser feita 1 combinando a OR b e o resultado se combina com AND

Exerccios Operadores booleanos


Crie buscas usando assuntos que representem os seguintes conjuntos: 1. 3.

2.

4.

Linguagem de indexao e de busca


Linguagem de indexao: Termos ou cdigos usados como pontos de acesso em um ndice. Geralmente adota linguagem controlada (LC)

Linguagem de busca: Termos que so usados por um consulente ao especificar uma necessidade de busca. Podem ser Linguagem natural (LN) ou LC, desde que o usurio tenha acesso linguagem documentria adotada pelo sistema de recuperao da informao.

Linguagem natural e linguagem artificial ou controlada (LOPES, 2002)


CONCEITUE LINGUAGEM NATURAL

a linguagem usada habitualmente na fala e na escrita representadas na base de dados pelos termos do ttulo e resumo.
CONCEITUE A LINGUAGEM CONTROLADA

o conjunto de termos organizados de forma hierarquizadas e/ou alfabtica, com o objetivo de possibilitar a recuperao de informao temticas, reduzindo substancialmente a diversidade de terminologia.
Tarefa: Pesquisar conceitos de LN e LA/LC/LD em outras fontes de informao da rea. Entrega: Prxima aula. (no esquecer de referenciar as fontes adotadas).

Diferenas entre Linguagem natural (LN) e linguagem controlada (LC, LC)


Linguagem natural ou livre (LN) Busca direta no texto Usa linguagem comum do usurio Oferece mais pontos de acesso Oferece maior revocao Oferece menos preciso Linguagem controlada (LC, LA, LD) Depende de uma LD Distancia-se da linguagem do usurio Os pontos de acesso so limitados pelo indexador Oferece menor revocao Oferece maior preciso

Tarefa: Ler o texto LOPES, I. L. Uso das linguagens controlada e natural em bases de dados: reviso de literatura. Ci. Inf., v. 31, n.1, Braslia, p.41-52, jan./abr. 2002 e CRIAR QUADRO COMPARATIVO ENTRE LN E LC Entrega: prxima aula.

Revocao e Relevncia (Lancaster, 2004)


Revocao (recall)

Capacidade de um SRI em recuperar itens existentes na base de dados. Preciso mede quantos documentos relevantes foram recuperados

Relevncia (Preciso)

Capacidade de um SRI em recuperar itens teis ao usurio e minimizar a recuperao de documentos inteis.

Frmulas para avaliar um SRI (Revocao e Relevncia)


Itens no Itens recuperados recuperados Itens no Relevantes (D) Relevantes (A) recuperados Relevantes (D) Itens no recuperados no Relevantes (C) Itens recuperados no Relevantes (B)

Revocao R= A / (A+D)

Relevncia P = A / (A+B)

Revocao = relevantes recuperados/ total de itens relevantes que existem no sistema Preciso = relevantes recuperados/ total de itens recuperados

Revocao e Relevncia
Esses dois parmetros so inversamente

relacionados, significando que a melhoria de um implica na piora do outro. Tradicionalmente, existem dois fatores muito importantes que governam a eficincia da indexao de um documento e consequentemente, influenciam na revocao e na preciso:

Exaustividade: Define o nmero de diferentes conceitos (tpicos) que esto indexados. Especificidade: Define o grau de preciso da linguagem de indexao em descrever um dado documento.

Referncias
ARAUJO JUNIOR, R. H. Preciso no processo de busca e

recuperao da informao. Braslia: Thesaurus, 2004. DIAS, M. M. L.; DIAS, E. W. Anlise de assunto: teoria e prtica. Braslia: Briquet de Lemos, 2007. GROSSI, M.G. R. Estudo das caractersticas de software e implantao de um software livre para gerenciamento de bibliotecas universitrias federais brasileiras. 2008. Tese (Doutorado em Cincia da Informao) UFMG, Belo Horizonte, 2008. LANCASTER, F. W. Indexao e resumos: teoria e prtica. 2.ed. Braslia: Briquet de Lemos, 2004. LOPES, I. L. Uso das linguagens controlada e natural em bases de dados: reviso de literatura. Ci. Inf., v. 31, n.1, Braslia, p.4152, jan./abr. 2002.

Referncias
NUNES, L. Da Classificao das Cincias

classificao da Informao: uma anlise do acesso ao conhecimento. 2007. Dissertao (Mestrado em Cincia da Informao) - PUC de Campinas, 2007. Disponvel em <http://www.bibliotecadigital.puccampinas.edu.br/tde_busca/arquivo.php?codArquivo =340 > Acesso em 22 nov. 2009 PIEDADE, M. A. R. Introduo teoria da classificao. Rio de Janeiro: Intercincia, 1977. ROWLEY, J. A biblioteca eletrnica. 2.ed. Braslia: Briquet de Lemos, 2002. SARACEVIC, T. Cincia da informao: origem, evoluo e relaes. Perspec. Ci. Inf., Belo Horizonte, v. 1, n.1, p.41-62, jan./jun. 1996.

You might also like