谷歌浏览器插件
订阅小程序
在清言上使用

融合半监督学习与RoBERTa多层表征的中文医学命名实体识别

ZHANG Shuai, GAO Xiao-yuan,YANG Tao,LIU Jie

Software Guide(2023)

引用 0|浏览29
暂无评分
摘要
为减少现有的深度命名实体识别(NER)模型对高质量标注数据集的依赖,面向医学文本解析,提出一种基于半监督学习与RoBERTa多层表征融合的医学命名实体识别方法.该方法在RoBERTa-wwm-ext-BiLSTM-CRF多层表征融合模型基础上,设计伪标签方法扩充数据样本,构建噪声减弱模块以缓解伪标签数据中噪声的影响.在CCKS 2021医疗命名实体识别数据集和CBLUE CMeEE数据集上的实验结果表明,该方法与经典的BERT-BiLSTM-CRF方法相比,F1值分别提升了1.14%和1.63%,表明引入半监督学习策略并融合RoBERTa多层表征信息的命名实体识别方法可以有效提高医学实体识别效果.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要