Représentation évolutive de mots

msra

引用 23|浏览2
暂无评分
摘要
RESUME. Cet article présente le dispositif expérimental GASPAR qui construit des représentations des mots sous la forme d'objets informatiques appelés des prototypes. GASPAR associe à ces objets les comportements syntaxiques et sémantiques des mots en prenant appui sur des informations extraites à partir d'un corpus. GASPAR a pour première tâche de construire progressivement une représentation informatique des mots, sans présumer de leurs descriptions linguistiques ; il doit ensuite reclasser les mots représentés et mettre au jour, de manière inductive, les classes de mots du sous-langage étudié. Cette phase de classement prend appui sur une recherche de clusters d'entités ayant un comportement plus homogène. Nous montrons comment la programmation à prototypes permet de représenter des mots dynamiquement par apprentissage et par affinements successifs. Elle permet ensuite d'amorcer un début de classement de ces mots sur la base de leurs contraintes syntaxico-sémantiques en construisant des hiérarchies locales de comportements partagés. ABSTRACT. This paper present a NLP system called GASPAR. This system's aims is first to build evolutive representation for words with objects called prototypes, second to classify these objects according to the linguistic information associated to these objects. Our goal is to develop an approach in which word representations can continually evolve according to their behaviors in corpus. This work of progressively refining word representations leans on a method of clustering words. We present the prototype-based paradigm and its applications for the representation and for the classification of words represented as prototypes. We describe how we can use a prototype-based language to generate automatically objects, defined step by step, and how a prototype-based language allows to classify these objects according to the associated constraints
更多
查看译文
关键词
langage à prototypes,mots cles : linguistique basée sur corpus,apprentissage et classification automatique keywords : corpus linguistics,learning and classifying automatically,prototype-based language
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要