Anotação de sentidos de verbos em textos jornalísticos do corpus CSTNews

Revista de Estudos da Linguagem(2015)

引用 0|浏览18
暂无评分
摘要
Resumo : Um dos problemas mais dificeis de serem tratados no Processamento de Linguagem Natural (PLN) e a ambiguidade lexical, pois as palavras podem expressar sentidos distintos de acordo com o contexto no qual elas ocorrem. Em PLN, a tarefa responsavel por determinar o sentido adequado de uma palavra em contexto e a Desambiguacao Lexical de Sentido (DLS). Nessa tarefa, o uso de corpus anotado e muito util, pois esse recurso linguistico computacional permite o estudo mais aprofundado da ambiguidade, assim como o desenvolvimento e a avaliacao de metodos de DLS. O presente trabalho relata o processo de anotacao de sentidos dos verbos em textos jornalisticos presentes no corpus CSTNews, usando-se a WordNet de Princeton como repositorio de sentidos. As contribuicoes deste trabalho incluem a disponibilizacao de um recurso linguistico que serve de base para futuras pesquisas em DLS para o portugues, alem de detalhar o processo de anotacao e seus resultados. Palavras-chave : Linguistica de Corpus; Desambiguacao Lexical de Sentido; Portugues Brasileiro. Abstract : One of the hardest problems in Natural Language Processing (NLP) is the lexical ambiguity, as words may express different senses depending on the context in which they occur. In NLP, Word Sense Disambiguation (WSD) is the task that aims at determining the proper meaning of a word in its context. In this task, the use of a sense annotated corpus is useful because this RELIN, v. 23, Edicao Especial, 2015. 799 computational linguistic resource enables further study of the ambiguity phenomenon and the development and evaluation of WSD methods. This paper describes the verb sense annotation process in news texts in the CSTNews corpus, using Princeton WordNet as sense repository. Besides detailing the annotation process and its results, the contributions of this work include the availability of a linguistic resource that may be the basis for future research in WSD for Portuguese. Keywords : Corpus Linguistics; Word Sense Disambiguation; Brazilian Portuguese.
更多
查看译文
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要