融合半监督学习与RoBERTa多层表征的中文医学命名实体识别

ZHANG Shuai, GAO Xiao-yuan,YANG Tao,LIU Jie

Software Guide（2023）

引用 0|浏览29

暂无评分

摘要

为减少现有的深度命名实体识别(NER)模型对高质量标注数据集的依赖,面向医学文本解析,提出一种基于半监督学习与RoBERTa多层表征融合的医学命名实体识别方法.该方法在RoBERTa-wwm-ext-BiLSTM-CRF多层表征融合模型基础上,设计伪标签方法扩充数据样本,构建噪声减弱模块以缓解伪标签数据中噪声的影响.在CCKS 2021医疗命名实体识别数据集和CBLUE CMeEE数据集上的实验结果表明,该方法与经典的BERT-BiLSTM-CRF方法相比,F1值分别提升了1.14％和1.63％,表明引入半监督学习策略并融合RoBERTa多层表征信息的命名实体识别方法可以有效提高医学实体识别效果.

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要