新冠领域溯源类论文筛选及全文实体标注研究

XU Shuo, ZHANG Mengmeng,LIU Liyuan,WANG Congcong, SUN Rui, LI Yilin,XU Jinnan,AN Xin

Journal of Library and Information Science in Agriculture(2023)

引用 0|浏览18
暂无评分
摘要
[目的/意义]新冠病毒出现以来,国内外与新冠病毒研究相关的论文迅猛增长.整理国内外COVID-19相关学术论文,创建针对新冠溯源类论文的数据集和细粒度的实体数据集能为新冠病毒的起源和传播机理等相关研究提供坚实的数据支撑.[方法/过程]提出基于主动学习模型的论文筛选方法,从海量论文中高效精准地定位与新冠溯源相关的论文.同时,设计了一种新冠领域18类实体的标注方案,不仅包含生物领域通有的基因、蛋白质和化合物等实体,还涵盖新冠领域特有的冠状病毒、野生动物等实体.[结果/结论]构建了一个新冠溯源类论文数据集,共包含885篇文章;基于提出的实体标注方案,标注全文本论文99篇,构建了一个细粒度的实体数据集,包含39118个实体,是目前新冠领域规模最大、最全面的实体标注数据集.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要