Le corpus ANCOR_Centre et son outil de requêtage : application à l’étude de l’accord en genre et nombre dans les coréférences et anaphores en français parlé

SHS Web of Conferences(2014)

引用 6|浏览6
暂无评分
摘要
Cet article presente les premieres etudes de corpus realises sur ANCOR_Centre, un nouveau corpus de francais parle annote en relations de coreference ou anaphoriques. Par sa taille (488 000 mots, 100 000 mentions, 50000 relations), ce corpus est sans equivalent sur le francais et soutient la comparaison avec les plus grands corpus de coreference existant sur d’autres langues. Dans un premier temps, nous detaillons la realisation de cette ressource qui est diffusee librement sous licence Creative Commons. Puis nous presentons l’outil de requetage associe au corpus, qui offre a la communaute des sciences du langage des capacites d’analyse exhaustives et precises du corpus, autant pour des etudes quantitatives que qualitatives (concordancier). Cet outil a ete utilise pour decrire quantitativement le contenu du corpus ANCOR, ce qui fait l’objet de la troisieme partie de l’article. Enfin, nous presentons une etude originale basee la encore sur l’analyse par requete du corpus, qui montre qu’en francais parle, l’hypothese d’accord systematique en genre et nombre entre la coreference et son antecedent est loin d’etre assuree
更多
查看译文
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要