Uma Abordagem para o Gerenciamento de Tesauro Multilíngüe Baseado em Amostra de Textos Comparáveis

msra

引用 23|浏览5
暂无评分
摘要
Resumo - Sistemas de Recuperação de Informações Multilingüe normalmente baseiam-se em tesauros e devido a fenômenos lingüísticos, o processo de criação e manutenção é complexo. Um tesauro é projetado para indexar e recuperar documentos num domínio específico. Este artigo descreve uma nova abordagem para auxiliar no gerenciamento da manutenção de um tesauro multilíngüe para a área médica, por meio de amostras representativas de textos bilíngües comparáveis para a detecção de potenciais representações ou classes de sinônimos ou relacionamentos semânticos que venham a prejudicar o desempenho do processo de recuperação de documentos médicos relevantes. A técnica também pode ser aplicada com a utilização de corpora comparáveis e apresentou resultados positivos apesar de utilizar-se de um tesauro consolidado. Palavras-chave: Recuperação de Informações Multilíngüe, Gerenciamento de Tesauro, Corpora Comparáveis. Abstract - Cross-Language Information retrieval system is normally a thesauri-based and due linguistics phenomena the building and the maintenance is complex. A thesaurus is designed for indexing and searching in a specific domain. The goal of this article is to introduce a novel approach to aid the manager of a medical multilingual thesaurus though bilingual samples of representatives texts in order to detect potential representations or classes of synonymous or semantics relationships which can reduce the performance of information retrieval process of relevant medical documents. The technique can also be applied through comparable corpora and it has shown positive result in spite of using a consolidated thesaurus.
更多
查看译文
关键词
cross-language information retrieval,.key-words: thesaurus management,comparable corpora.
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要