基于粒子群优化的文档子内容查重算法

Computer Engineering(2011)

引用 1|浏览1
暂无评分
摘要
现存的文档相似性算法虽然能够获得2篇文档的相似度,但不能判断出重复或最相似子内容的位置.为此,提出一种基于粒子群优化(PSO)的文档内部子内容的查重算法.利用PSO方法查找2篇文档中最佳相似子内容的位置和长度,设计一种相关函数来判断字符串之间的相似程度,从而得到粒子群的评估函数.测试表明,该查重算法能够快速准确地确定出重复或最相似子内容的位置与长度.
更多
查看译文
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要