基于Gaussian LDA与谱聚类融合的代表性负向评论提取

吴银昊,那日萨, 李慧

Information Science(2021)

引用 1|浏览0
暂无评分
摘要
[目的/意义]在线评论尤其是负向评论是消费者进行购买决策的重要依据.而现有减少信息冗余方法在负向在线评论中表现还有待提高.[方法/过程]文中提出了一种基于Gaussian LDA的负向评论谱聚类方法.首先,利用Gaussian LDA模型获取负向评论中的主题分布,然后通过主题分布来计算评论间的皮尔森相似度,并应用谱聚类算法实现负向评论聚类,最后提取每类距离簇中心最近的m条评论作为该类的代表性评论.[结果/结论]通过将Gaussian LDA、LDA、TF-IDF和Doc2Vec分别与谱聚类结合,以及将Gaussian LDA与K-means、DBSCAN、谱聚类结合进行交叉比较,验证了所提方法的优越性.据此提取的负向评论类别间区分度高,具有高度代表性,较好地解决了信息冗余问题.[创新/局限]先提取主题再进行聚类的多模型集成式聚类方法为解决评论信息冗余问题提供了新的方法和思路,也为研究文本挖掘、文本聚类提供了一种新的参考.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要