Le corpus ANCOR_Centre et son outil de requêtage : application à l’étude de l’accord en genre et nombre dans les coréférences et anaphores en français parlé

Anais Lefeuvre,Jeanyves Antoine,Emmanuel Schang

SHS Web of Conferences（2014）

引用 6|浏览6

暂无评分

摘要

Cet article presente les premieres etudes de corpus realises sur ANCOR_Centre, un nouveau corpus de francais parle annote en relations de coreference ou anaphoriques. Par sa taille (488 000 mots, 100 000 mentions, 50000 relations), ce corpus est sans equivalent sur le francais et soutient la comparaison avec les plus grands corpus de coreference existant sur d’autres langues. Dans un premier temps, nous detaillons la realisation de cette ressource qui est diffusee librement sous licence Creative Commons. Puis nous presentons l’outil de requetage associe au corpus, qui offre a la communaute des sciences du langage des capacites d’analyse exhaustives et precises du corpus, autant pour des etudes quantitatives que qualitatives (concordancier). Cet outil a ete utilise pour decrire quantitativement le contenu du corpus ANCOR, ce qui fait l’objet de la troisieme partie de l’article. Enfin, nous presentons une etude originale basee la encore sur l’analyse par requete du corpus, qui montre qu’en francais parle, l’hypothese d’accord systematique en genre et nombre entre la coreference et son antecedent est loin d’etre assuree

查看译文

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要