一种基于聚类的文章自动摘要方法及实现

Jianquan Tang,Hongbo He,Runqiang Wang

E-science Technology & Application(2019)

引用 0|浏览2
暂无评分
摘要
本文提出一种基于聚类的自动摘要方法,该方法将文章中所有句子转换为句子向量,并且使用基于AGNES的算法对删除离群点后的句子向量进行聚类,形成多个句子向量个数不超过设定阈值的簇,删除句子向量个数极少的“无用”簇后,从每个簇中挑选出最能代表簇的语义的一个或者两个句子,根据每个句子到语义中心的距离等信息从小到大确定指定数量的几个句子作为关键句,拼接成文章摘要.通过在中国科普博览网站上随机挑选的500篇科普文章上进行实验,上述方法各项指标均优于基于图模型的TextRank算法以及基于统计的方法,证明了该方法的有效性和可用性.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要