基于BERT与Text-CNN的抗菌肽识别方法

Chinese Journal of Biotechnology(2023)

引用 0|浏览10
暂无评分
摘要
抗菌肽(antimicrobial peptides,AMPs)广泛存在于生命体中,是一种具有广谱抗菌活性、免疫调节功能的小分子多肽.抗菌肽不易产生耐药性,适用范围广,具有极大的临床价值,是传统抗生素的有力竞争者.识别抗菌肽是抗菌肽研究领域中的重要研究方向,湿实验法在进行大规模抗菌肽识别时存在成本高、效率低、周期长等难点,计算机辅助识别法是抗菌肽识别手段的重要补充,如何提升准确率是其中的关键问题.蛋白质序列可以被近似地看作是由氨基酸组成的语言,运用自然语言处理(natural language processing,NLP)技术可能提取到丰富的特征.本文将自然语言处理领域中的预训练模型BERT和微调结构Text-CNN结合,对蛋白质语言进行建模,提供了开源可用的抗菌肽识别工具,并与已发表的5种抗菌肽识别工具进行了比较.结果表明,优化"预训练-微调"策略带来了准确率、敏感度、特异性和马修相关系数的整体提升,为进一步研究抗菌肽识别算法提供了新思路.
更多
查看译文
关键词
antibacterial peptides recognition method,bert,text-cnn]
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要